2026.4.18 - 2026.4.20
-------------------------------------------------------------------------------------------------------------------------
2026.4.18,我们夜里调试这个狗屎系统 + 调试prompt一直调试到4点。我的天哪。
我真不想这么说,但是我必须对自己诚实。所以我不得不这么说,最近有些过分了。
……东西真的好像做不完一样。搭建这个agent花费了我们好几天时间。
嘛,就这样。修正这种东西真的很累。
最终是下午2点起来的。
4点半去健身。最终回来的是8点。
这次最大的价值是弥补了之前的尴尬气氛。现在可以顺理成章的提出一起去看看的请求。
全天都在修正这个系统。做了一个cc账号切换 + 具体系统落成。
明天不得不去处理现有手头上的问题。然后我们回来继续弄系统。
-------------------------------------------------------------------------------------------------------------------------
2026.4.19,今天的计划是在4.22才整备完毕的。因为这两天几乎都在忙于调试各种各样的系统。
……我承认最近熬夜有点过分了。我看表上,我的睡眠时间在早上6点40,一直睡到下午2点。虽然这也是7小时,但是未免有点过分了……
因此,实际上半周多,我们都熬夜熬到这种时候,真的……唉。这两天调整作息吧,好在系统的工作看起来还算是比较正常。
夜间我一直在修我们的自动系统。这个自动系统……真的是,让AI修,一下子就要修半个小时到一个小时。几轮prompt下来就马上到凌晨。
之前没有打开CT真的是我们的重大失误。因为实际上计算时间,你如果从早上开始弄,实际上效率并没有多少提升,一天仍然要大概7 - 8小时的睡眠,昼夜颠倒还损害了效率和正常流程。
下午开始整理实验数据和论文。同样是简单做了一些。但是晚上的汇报让人不满意,因为师兄要求我把它弄到模板上,但是我因为模板实在有点糟糕所以没弄。
我晚上让AI帮我搬迁了一下。这就做完了。现在的AI真是太强了。只是我们的token在哗哗烧确实是有点让人感到不安。不安です。
不过反过来说,只要token没有用完,我们就可以继续前进。而且,越是发射后不理的系统,越是理想。Fire-and-forget。
总的来说其他就没事了。真是狗屎啊。就这样。
◇劇情簡介
回想起來,我從一開始就錯了。
救治身患重病的母親,
這對我來說,只是一個普通高中生,根本不可能做到。
「呃……什麼……叔叔……?」
我的第一個「客人」是個騙子。
光是一起吃頓飯就要一萬日元,光是在飯店休息就要三萬日元。
那時的我太天真了,竟然相信了他的話。
「停!停,啊!啊……啊啊啊!!」
他把我推倒在床上,射在了我的體內。
事後……客人離開了飯店,留下了十萬日元,說是封口費之類的。我
唯一留下來的,只有初夜被奪走的失落感,以及收到一大筆錢的滿足感。
也許我可以用我的身體來賺錢,支付母親的醫療費。
那一刻,我彷彿在黯淡的世界裡看到了一絲希望的曙光。
光是看到就让我感到不适的剧情介绍。
这种不适并非厌恶作者的不适,而是“这是怎么发生的?”的不安和郁闷感。
钢琴家 Maria João Pires 坐在阿姆斯特丹皇家音乐厅。当 Riccardo Chailly 带领乐团奏响莫扎特第 20 钢琴协奏曲时,你看到她猛地一震——她准备的是另一首协奏曲。有那么一瞬间可见的恐惧,然后她稳住了自己,转向键盘,出色地演奏了正确的协奏曲。
虽然第一反应是,天哪。第二反应是,似乎也能理解。
为什么?我也有这样的事情。只是那不是愉快的经历。是有人把游戏主持的任务临时推给了我。
于是我上台临时发挥了一下。实际上真的是胡乱组织,但是最终弄下来了。并没有太多人在意。当然这个场景是另一码事。
不过……确实是,可以做到。而且超越极限,本身或许确实是让人感到非常紧张但是却真的能让人成长的过程。
-------------------------------------------------------------------------------------------------------------------------
2026.4.20,仍然是22号补充的计划。而且今天也是,熬夜到4点。今天就没有任何正当理由了,单纯只是在看曹操传。
不得不说早期光荣作品就这样,有点离谱。离谱在哪里呢?就走的线都是很玄幻的线,变成放飞自我了。也就是因为这种缘故所以我不是很喜欢曹操传的风格。
基本上现在心目中的排序就是姜维传 > 孔明传 > 曹操传吧。这种感觉。曹操传说是玩法拓展了,可能吧,希望吧。反正就那样。
我之前应该是看过它的录像的,只是我想不起来是什么时候看的了。因为孔明被魔王附身这种神必剧情我印象太深了以至于我居然还有一些印象。
起来的时候已经是中午12点了。首先吃了个饭,然后摸了下鱼。
下午的时候正式开始做论文PPT。真的是突然想起来下午还要上课,当时还以为必定做不完了。
不过下午的效率极高,非常快的就把算法等都看完了。晚上的汇报也非常顺利的就通过了。
果然对我来说,只要讲清楚自己的动机,以及挑选比较好的论文,并做好多个准备就好了。今天的讲演算是非常好的示范。同时也在论文追踪上也给我了启发。
试图去追踪这一条链,比我追踪多个点要好。反正这很难表述,不过这应该是好事。
晚上剩下的时间调了一下竞赛的东西。竞赛这里我尝试调通框架的速度,但是并没有成功。
这个傻逼系统不知道哪里脑袋抽了,程序跑动速度非常慢。所以本来我们的目标是优化它。
优化了半夜,终于是完成了优化。之后我们就可以以非常快的速度跑动了。这一天就这样了。
一个思路:
有些工作不能顶格做,而就应该一次性量化好完成时间——然后临时做。
一方面是【不完美】这个概念的落实,另一方面是,如果留给自己3天的时间去做,那么真的会花3天的时间去做。
对于DDL工作,这样做是合适的;对于自己喜欢的事情,则尽可能放到轻松的时候,尽可能早期完成。
——这和我们原来的思路是反着来的。但是我觉得,这可能才是正确的思路。有些工作,真的不是越早完成越好。
考虑到人类其实是先验非常强的一种RL体,我突然想到,相反的,人生的容错率,说不定是巨大的。
为什么呢?因为实际上,就如同我说的,人类正因为其先验非常强,所以很多时候做出来的选择并不理性甚至是不合乎逻辑的。
但是人仍然能活下去。有时候我都很难定义这种奖励函数。难道,死亡才是最大的负分吗?但是这在Agent上并不管用。
啊,对不起,说偏了。我的意思是,先验如此之强,按照道理来说,走错了路,那就应该是直接废了或者死了才对。
不过实际上最终大多数人,只要不是意志之外,大多能活下去。正如那句话所言,人只要满足一天摄入2000大卡,就算是完成了主线任务。
——一些事情,甚至我们都没有意识到它其实是错的。但是我们就这样走下去了。
我们摸一下桌面,不会导致整个现实世界振荡起来,即便有蝴蝶效应。能量收敛了。
……从这些角度来说,人生的容错率真是大的可怕。果然大多数难度,都是……自己或者他人的恶意给的呢。
如果不这么解释的话,像我们这种充斥着偏差和误解的个体,又是怎么这样保持存活的呢?
……人果然还是贪心了。这正是好玩的地方。
我们人类思考更类似一种潜空间解码——或者说,只是我。
和AI聊天的时候,说是有两种模式呢?一种是我们先有语言,然后表达;但是另一种,则是先有感觉,然后我们从语料库中检索/直觉得到词语。
前者是显式CoT,后者是隐空间CoT?
我呢,也在思考一种树状、Agent式的思考结构。类似于Agent一样的思考结构。
也就是将sub-Agent的架构直接融入模型中。这不是什么新颖的观念,不过或许可以参考。
直到今天,坛娘都还未恢复。到底发生了什么呢?