2025 Blog Develop Diary

· Last updated: 2025-09-13 4636 字 · 19 分钟

引言

每次把personal page提上日程,用模板嫌不好看、自己调UI很难一下子满意,最终总是冲激函数式更新。 决定这次要坚持更新并记录进度(主要是内容和排版),看看一年之内,这个小破网页会有什么样的变化。

初始状态

初始状态

25/07/25

  • 周二刚刚入职北京base,周二周三看了一下飞书知识库,大概了解了一些规则和制度,以及认识了一些同学,也问了mentor们/卡的一些情况,感觉还是等WAIC大会结束之后再说吧。
  • 周四打算开始读paper -> 觉得paper还是得记笔记才行 -> 于是顺理成章决定先恢复一下个人主页吧。有精力经营pyq不如经营personal page 🙌🏻。周四费了老大劲捡起了之前本就不多的前端功底,把颜色、排版、页面规划了一下。回去的时候因为没带伞,路上花了不少时间,到家就已经11点了,继续捣鼓到12点半,又看了一下NeurIPS的评语,发现user study因为case太少被四个审稿人每人骂了一遍。唉,indoor scene资产质量缺乏行之有效的metrics这个事情已经不是一天两天了啊。
  • 比较地狱的是我发现我从审稿人那里得到的科研指导比我本科期间加起来还多。我是不是应该反思一下我跟人沟通的技巧…或者以后挑导师认真一点🧏‍♀️ 希望这篇能扒成功…
  • 周五好像有点阳了,嗓子痛、头疼,睡不醒。半睡半醒休息一上午,两点到公司,继续优化主页,主页面基本成形,导航栏、paper reading栏也set up起来了,打算再传一篇reading blog然后去跑步爬楼梯

25/07/26

  • 今天把导航栏、滚动停留、blog页面排版解决了一下,感觉差不多能看了,至于其他精细的小彩蛋(鼠标效果、进度条、留言、favicon、paper timeline什么的先不管了)
  • 想洗掉模板有点麻烦诶…好多小细节,各种标题颜色什么的
  • 先去跑跑步,回去之后更几篇paper reading,第一阶段结束!

结束留念! 图片

  • 第一周过得好快。

25/07/27

  • 问题真是越解决越多啊…又发现了页面渲染闪烁的问题

  • 今天优化页面渲染闪烁,以及把research diary的card的格式调整好,让它不要去截断blog content,而是另外起一个summary 图片

  • 还想解决一下blog和diary页面的居中美观度,以及增加tag功能

  • 最后就是把昨天挖的坑填一下,去读paper、写paper blog的内容

  • 后面要逐步解决的问题:移动端优化、中英文切换、留言、paper tag network(要是能做author network就好了)

  • 后续:加载闪烁问题在localhost会比较严重,传到github.io之后就好了…?那就先这样吧

25/07/28

  • 今天增加了表格样式,修改了分割卡片的符号(发现跟表格会冲突)。debug一小时找改了颜色格式就会全部消失的原因,得出的结论是单纯因为渲染太慢了💦。
  • 今天还增加了目录跳转和高亮阅读跟随
  • 今天少在意一些排版和前端,主要是看paper和梳理内容。
  • 按照顺序写一下agent、VLA、3D scene
  • Teleoperation刚开始学,先收集一下高引/高star project
图片

25/07/29

  • 增加一个每篇文章阅读时间
  • 继续写agent、VLA、3D scene和Teleoperation

25/07/30

  • PMS好严重,每天早上起来各个关节、各条肌肉纤维都像被人狂揍了一顿一样
  • 月经再不来我人就要走了。感觉自己脑子上下文滑动窗口的size从1000词变成了50词,论文都看不懂
  • 今天偏头痛了一整天,非常非常神志不清,最气人的是晚上回去又好了…想给自己绝育

25/07/31

  • i人内耗,内耗了半天不敢去问mentor具体做项目的事
  • 今天PMS好了一些,能正常工作了,但是偏头痛仍然有一些实感
  • kua kua写VLA和3D scene,同时今天嗅到了一些VLA+RL的苗头
  • 这两天不怎么关注page的前端了hh,好事,说明page已经基本完工了

25/08/01

  • i人小垃圾的日常😭——对朋友侃侃而谈要做A做B大展宏图,跟mentor发消息在文件传输助手里排练了两天半。但今天终于问出去了55,开启向上管理之路
  • 今天PMS完全结束了,比上个月推迟了4天,所有的头疼犯困和emo在月经到来的一瞬间烟消云散了!爽!
  • 爆更完了3000字3d indoor scene synthesis,神清气爽,前半年没有人指导自己摸索的努力都没有白费。
  • 开始更VLA和teleoperation
  • 今天发现页面有渐变色的话非常清透漂亮
  • 感觉blog多了之后页面好乱,得想办法好好目录一下

week 1

这周总结了agent相关的一些paper和概念,总结了上一段科研成果里了解到的3D scene synthesis的paper和套路(请允许我说是套路哈哈),get了VLA领域最近半年的基本情况(因为太能睡了,只仔细看了instructVLA),下周计划找mentor问下下一步要怎么focus到具体项目上,以及申请一张卡跑一些实验体会VLA不同action generation方法的区别。

不得不说因为PMS头晕脑胀浪费了大量时间…来之前困,来之后也困,感觉脑子这半年通宵通坏了。真正的低精力人群,是每天除了睡觉,连玩游戏看小说都没精力的。我认为不是做事情本身难以开始,而是多个事情要兼顾(比如做饭,读paper,更网站,健身…)的能力被高中整退化了,做一个事情下意识扎进这个事做好久,导致不想开始。除了克服睡眠问题之外还要注意快速进入状态的能力和行动力呀。

还有就是保研的事其实还没完,后面还要预推免走过场(我勒个1400来回高铁,没钱去迪士尼了)😓洒脱都是装出来的,现在仍然会时常后悔要是本科某次做选择的时候选什么什么就好了。为高中的时候拼命的自己而难过,老师和家长大言不惭地承诺考上了清北就会鹏程万里,然而滋养了家校的声誉和虚荣后,没有人关心我们下一步要怎么走。像是一只无根的浮萍,漂泊漂泊漂泊。

人们总是以为没走的那条路上开满了鲜花。

虽然不喜欢校园生活了,但总归还是幼稚的20岁,都读研了当然是跟着导师跑啦。毕业去向去上海没谁会care,咋读个研去上海这么多心理活动🤣。可能我在科研上收到足够的正反馈之前一直会这样难过,而在科研上收到正反馈又是何其可遇而不可求的事啊。埋头move on,交给时间吧。

其实每天起来之后也不困,但如果没有咬牙起来就会一直睡一直睡😭我不会缺vd吧(补了一点之后感觉还真是)

痛定思痛。下周要每天7点起来,早上9点到公司,打满11个小时卡,更完RL和teleoperation(然而其实没有更完而且开了更多坑…),并且focus到具体项目上。做不到就吃三天的鸡胸肉😠(其实只是想借机减脂)。

25/08/04

  • 又出现了肿和困,不会缺vd吧
  • 今天北京发了暴雨红色预警诶,cancel了和朋友的meeting。毕业之前想和100个人约饭。
  • 今天开了个新坑compression,想学一下大模型相关的tech(要是单做大模型这部分我看半小时就能睡着)愈发意识到VLA和大模型其实没什么太大的本质区别,这个field的真机浓度感觉刚刚好
  • 开始囤RL的paper和manip benchmark的paper,我看我看我看看
  • 想做VLA+RL,猛学!

25/08/05

  • 睡眠问题越来越严重了,经期困?缺vd?之前通宵太多作息颠倒?…呜呜明天说什么都要开始早睡早起😭
  • 今天把VLA browse完了,也大致看了一下有无环境/sim real的VLA RL,这个领域好费卡
  • 修复了一下reading note渲染出来列表项的字号大的问题,咱也不知道到底什么问题反正在style里面一通乱important就解决了。

25/08/06

  • 今天找mentor申了一下4090
  • 继续更VLA,确实VLA好同质化,好好想想要实现最终目标还有什么技术路线,做同质化的东西总归是不值得的
  • 无聊了再看两眼teleoperation
  • 吃完vd感觉整个人精神状态好多了?白天想睡都睡不着。起效这么快,怪啊,难道是安慰剂效应?

25/08/07

  • 今天第一个闹钟6:30就醒过来的时候我是震撼的。真缺vd啊。
  • 今天帮3DV跑了一点gs渲染(时间大部分都花在配环境上了)
  • 想给webpage开发一个来访者功能(开始拖延)

25/08/08

  • 今天一天状态都非常非常好,人还是得10点起床啊(瘫)
  • 本来想这周更完RL和teleoperation,然而其实没有更完而且开了更多坑…
  • 最近browse了40来篇paper(写笔记的速度比browse慢多了,汗流浃背),打算这个月当作把握领域动向的狂读paper阶段,怒读个200+,并且立志边读边列实验
  • 帮挂名的3DV跑了点实验,感觉3D场景表征做推理的时候好低效(不撞东西这方面可能需要3D信息,不过相关技术应该很成熟了吧,参考扫地机器人),更赞成在real world里做VLA+VLN的RL
  • 想在gallery里记录毕业季的wish list,加了一点gallery排版

25/08/13

  • 从郑州回来,休假结束,大站快车真的好爽诶,就是有点贵…
  • 申请了权限但是找不到是哪个集群,起码有3个4090集群。两个小时试图登陆服务器最终只登上了堡垒机,拼尽全力无法战胜,明天找人问吧。

25/08/14

  • 今天精神矍铄(误),人还是得2点睡10点起。9:40的时候打算睡到10:00,结果眼一闭一睁就10:40了,谁懂这种睡眠质量。于是赶紧爬起来,兑了一杯拿铁,连滚带爬去打卡了
  • QAQ dsw的集群管理好陌生,只会用8卡slurm小集群的我眼泪掉下来…整一天了才勉强整明白,也不太确定镜像常见的使用方法(是一个project一个dsw吗)以及连个2核CPU都没排上,以后难道要早点起来抢卡吗🤣
  • 嗷没事了,优先级给的太低了。事实证明不配得感会影响做科研🤦有点害怕可能自己得丢几次代码和环境才能学会熟练使用dsw呜呜呜 这时候就显示出github的重要性了
  • 10点下班滚回去之后继续读VLA+RL和teleoperation,今天智元也发了个视频生成为中心的平台,眼花缭乱

25/08/18

  • 今天是11:20到的,下午8:00才能下班。感觉自己太懒了,开始用番茄钟,效率还不错。
  • 今天加了一个密码功能(但感觉轻易就能被攻破,过几天琢磨一下网络安全?🤔)主要自己写的东西太炸裂了()还是不太想发布。生活太drama,不能总是实名上网,痛定思痛以后开始练写小说,扩大自己的写作域。
  • 加了一个访客足迹world location,要用vercel,需要研究后端和配置npm。今天的website番茄钟用完了,明天再做吧。
  • 补全了VLA sheet
  • 剩下的时间去玩一下桃源

25/08/25

  • 最近作息比较规律,今天是8:30起、10:40到的,但是可能还是会晚上9点多下班。不要再晚上两点睡啦亲!!!
  • 更新page的热乎劲过去了,最近又开始较为懈怠,网页颇有变成周更的趋势=.= 小红书也是周更
  • 上周一直在调Franka的摄像头手势控制,卡在了video stream发送到服务器的通信这一步,百试不得其解,于是暂时搁置。然后把GRscene下载下来,忘记了不要占用服务器带宽(应该用cpfs同步才对)的忠告,把别人给卡死了,收到提醒😓,无奈已经下了80%,如坐针毡地完成下载。解压后去朝阳站接对象回京。朝阳好有生活氛围呀,海淀果然是全国最不是人待的地方(特别是海淀黄庄附近…好压抑)
  • 周四帮collaborator调supp的video,一整天都在学校狂干活。熬了个通宵(一人吃了一整份十翅一桶,吃伤了,短时间内不会再买麦辣鸡翅🥹),凌晨三点告诉我camera编号给错了,所以需要重渲,真的会想掐死collaborator(calm down,不能掐一作qwq)
  • 被倒霉催对象传染了新冠,周四早上起来嗓子就不对头了。周五凌晨在C楼空调下睡了2小时,新冠更加严重,喷嚏特多,一打喷嚏上颚剧痛。sup材料处理完之后倒头就睡,新冠严重+通宵,几乎一觉睡到第二天早上(第二天正好是徒步了一整天,所以完全没回复mentor消息XD 尖叫旋转)。重病中跑到妙峰山受罪,下山挪了五公里的出溜滑石头路,摔得腿青胳膊肿😓周日因为过于疲劳睡到下午四点|||💦 周末可以除了徒步说什么都没干吧,新式养病
  • 这周的计划是调通所有的桃源教程、验证几个idea(或者应该叫小的疑问)。这周开工之前先看半小时paper吧~(这周争取每天能抽出来半小时更新paper)高效干活,周末还是要去徒步滴!
  • question list(简化版):
    • (core)应该用室内场景合成什么样的数据?
    • 现在vla的数据都是什么样的?
    • 现在的vla泛化性究竟如何?能以比较高的sr完成的是什么样的指令?(复现一个看看)
    • GRscene里面的数据格式?已经有的pipeline可以干些什么?
    • 提高interactivity(铰链,开火,开水管,软体仿真等)实现难度如何,会不会对泛化性有用?
    • sim2real gap有多大?能不能用ACDC类似的real2sim2real方法解决?
  • 暑假快要结束了,学费也交了,在thu的最后一年即将开始,回学校的饭吃一顿少一顿呀。早已进入常年工作状态的我当然是不会去上课的(通识点名除外),所以也没什么实感,只是隐隐想起下个月11号要答辩一下暑期实习,开学还差一节课没排上,以及得早点联系一个毕设老师。希望过年前我就能彻底解决掉以上这些疑问,过年后可以有机会在线下试验一下合成数据的训练效果。
25/08/27

  • 想给web paper blog加个图片功能(但是感觉嵌入做得不好的话,排版很容易变得巨丑)
  • 这两天下载好了所有感兴趣的代码和数据集,但是跑完demo就不知道该干什么了。和大篇大篇的代码大眼瞪小眼。在科研上我其实相当的萌新,又一次从熟悉的领域跳到了不熟悉的领域(只是没有去年这个时候和今年春天那会跳得那么大)。我接触AI领域只有10个月,这中间一大半时间还是被无效指导给耽误了去(本科早期碰到了太多0指导0反馈的糟糕科研经历,仿佛命中注定有渣导,感觉这辈子已经不指望能成为什么厉害的人物了,主打一个向命运屈服),刨去艰难困苦的保研,有效的学到东西的科研时间也就单纯的2、3个月而已。现在新领域我广泛地学了一个月,想idea很难深入到tech细节中去,科研有一种不知道什么时候才能想到可以做的东西、做得下去的困惑和苦恼。
  • 我现在可以称得上非常熟悉tech的领域就只有3D indoor scene synthesis。这个任务还有做下去的必要吗?它可能可以在具身训练链条的仿真场景上起到什么样的作用呢?
  • idea都是边做边想出来的,虽然现在想不出idea,但是可以提出一些疑问(其实疑问也很有可能就是idea,因为如果是可以回答的疑问应该很快就能找到答案的)。单纯看paper实在是容易hacking和浮于表面,准备另起一个research-diary系列(暂且命名为cue吧,做科研的线索),用回答疑问的方式往下推一推科研。另外就是希望早日有mentor可以聊聊idea给点参考。

图片

25/09/11

  • 近期加入了新的on-going group,适应和了解了一段时间(因为基本上换了从来没做过的方向orz,不过目标还是相同的),同时又因为别人thu预推免出结果而花时间内耗了一阵子(志愿报四过三,然后都拒了没参加考核),疏于更新。
  • 最近几天要把学校的专业实践答辩水过去(抽到了序号11,有点坐牢),然后去一趟上海把流程跑完。争取挤时间更新一些预定的功能吧。paper reading最近在飞书写了,更新的话纯搬运。
  • 这周4090集群的带宽非常非常感人,下载什么都是kb/s
  • 周末准备花时间和对象庆祝一下三周年,看蛋糕看了好几家,营造仪式感好累(INTJ发言)。

© Nataraj Basappa 2025