一到换季就睡不好啊……
生活
9 月了,天开始渐渐凉了。
- 这几天一直下雨,生怕住的地方变成蘑菇养殖场。
- 但是一到换季就睡不好。本来这几天压力比较大睡觉晚,加上睡不着醒得早,一天大概只有 5 小时左右的睡眠。
本周继续搞婚礼的各种东西
- 上周买了一大堆一大堆的婚庆用品,这周陆陆续续都到了
- 各种背景音乐、背景图也差不多选好了
- 电子请帖(哦,其实叫「画册」更准确些吧)也搞好了。队友还花了 30 块钱开了个 VIP,说是能看微信访客记录——好奇怪的需求和收费点
本周末和队友腻在家里做饭。
- 现在食材好贵啊……不到一斤牛肉花了 40(这个算正常),大半斤菠菜、一个西兰花、四个西红柿、8 个芋头、俩土豆,总共花了 40。
- 俩人 80 块钱吃两天,要说吧,也可以了……(毕竟出去吃一顿单人也要 40 呢)
打印照片打印上瘾了。
- 36 张像片打完后,又斥巨资买了 100 张相纸。希望下次打出来的照片能更好看些。(这次的都有点暗,似乎是饱和度和亮度都不太够)
- 于是斥巨资买了相册
- 买完相册后才发现之前的照片其实是 5 寸而不是 6 寸。
看了《八角笼中》,叙事太电影化了,感觉「啥时候该出现啥」都能猜得到。
学习和折腾
iPhone15 发布了,看了看似乎并没有换购的欲望。
- iPhone13 pro 还够用,就是电池有点不耐用了(86%)
- 大家都说 iOS17 在性能上有很大提升,不知道过几天系统升级后会不会好一点,至少希望 Facetime 的时候不用背后捆绑一个冰袋袋来降温
- 有点想换 Mac 了。目前发热严重,而且电池只能撑不到 3 小时,而且 TouchBar 坏了。但依旧是没啥换的动力。
- 不如好好备份一下,过几天全部刷掉,又是新手机/新电脑。
秋天了,几个温度计,特别是弱电箱温度计度数肉眼可见地降了下来。
- 但 NAS 依然好吵。这也是我睡不好的原因之一
- 我在想又没有什么办法,将所有存储全部挂载到小主机本地,然后这个存储每周向 NAS 同步一次。这样 NAS 也不用一直开机
- 群晖威联通快点出便宜一点的全闪 NAS 吧……
工作
在做数据和处理数据
- 数据标注。之前自己写送标脚本,也就手写个 SQL,用 Spark 查个表,结果拉到本地然后单机跑,4C16G 的小鸡也能 3 小时呼呼啦啦处理完。换成全 Spark 后,查表要消耗 500C 6000G,查表要接近 2 小时,然后处理要 7 个小时,最后因为超时执行失败。
- 训练网络。终于解决了环境问题,不再「import torch」花 3 分钟、从启动到跑到 DataLoader 要 20 分钟了。于是进展得还算……还算顺利吧。把视觉分支和文本分支都换成了大模型预训练过的 Weights,然后发现性能没有提升。——emm,好的吧。
- 同事说是输入图片大小的问题。本来想「重新跑一遍就好了」,后来说需要把数据重新打包一下,因为「之前打包为了省地方,就把图片给缩放到徐晓的那个尺寸了」。所以当实际用起来的时候明,因为图片大小和 Pre-train weighs 尺度不匹配,所以直接报错了。
还生成了一大堆 OCR 的训练数据
- 运营提来个需求,说希望支持 Hebrew。好家伙,又是一种从右到左的文本,而且需求比较小众。
- 本来《如何做 OCR 数据生成》总结都写好了,想着照着做就是了。
- 首先尝试自己的第二版代码,由于没判断 RTL 所以生成效果上会有问题。
- 然后尝试自己的第一版代码,发现报错,好像是不能获取 playwright 不能获取 Chrome 的 Driver——明明此前一点事儿都没有呢。查了半天没啥结果,放弃。
- 那么就去开发机上搞吧。然后发现报另外一个错
- 那么就试试开源的吧。可以说没一个能用的:要么不支持 RTL,要么跑例子就直接保存。找运营确认了好久,才确认「生成的东西全部颠倒了」,意思就是原本是「Hello!」但生成出来的是「!olleH」。
- 继续换回 Mac,换回自己的代码第一版,然后重建一下 conda 环境就好了。然后在本地 mac 上跑数据生成。可以说这是我第一次自己把 MacBook Pro M2 的风扇用转过。

天天都好累。
早睡,早睡,早睡!
发表回复