20230917


发布于

|

分类

,

一到换季就睡不好啊……

生活

9月了,天开始渐渐凉了。

  • 这几天一直下雨,生怕住的地方变成蘑菇养殖场。
  • 但是一到换季就睡不好。本来这几天压力比较大睡觉晚,加上睡不着醒得早,一天大概只有5小时左右的睡眠。

本周继续搞婚礼的各种东西

  • 上周买了一大堆一大堆的婚庆用品,这周陆陆续续都到了
  • 各种背景音乐、背景图也差不多选好了
  • 电子请帖(哦,其实叫「画册」更准确些吧)也搞好了。队友还花了30块钱开了个VIP,说是能看微信访客记录——好奇怪的需求和收费点

本周末和队友腻在家里做饭。

  • 现在食材好贵啊……不到一斤牛肉花了40(这个算正常),大半斤菠菜、一个西兰花、四个西红柿、8个芋头、俩土豆,总共花了40。
  • 俩人80块钱吃两天,要说吧,也可以了……(毕竟出去吃一顿单人也要40呢)

打印照片打印上瘾了。

  • 36张像片打完后,又斥巨资买了100张相纸。希望下次打出来的照片能更好看些。(这次的都有点暗,似乎是饱和度和亮度都不太够)
  • 于是斥巨资买了相册
  • 买完相册后才发现之前的照片其实是5寸而不是6寸。

看了《八角笼中》,叙事太电影化了,感觉「啥时候该出现啥」都能猜得到。

学习和折腾

iPhone15发布了,看了看似乎并没有换购的欲望。

  • iPhone13 pro还够用,就是电池有点不耐用了(86%)
  • 大家都说iOS17在性能上有很大提升,不知道过几天系统升级后会不会好一点,至少希望Facetime的时候不用背后捆绑一个冰袋袋来降温
  • 有点想换Mac了。目前发热严重,而且电池只能撑不到3小时,而且TouchBar坏了。但依旧是没啥换的动力。
  • 不如好好备份一下,过几天全部刷掉,又是新手机/新电脑。

秋天了,几个温度计,特别是弱电箱温度计度数肉眼可见地降了下来。

  • 但NAS依然好吵。这也是我睡不好的原因之一
  • 我在想又没有什么办法,将所有存储全部挂载到小主机本地,然后这个存储每周向NAS同步一次。这样NAS也不用一直开机
  • 群晖威联通快点出便宜一点的全闪NAS吧……

工作

在做数据和处理数据

  • 数据标注。之前自己写送标脚本,也就手写个SQL,用Spark查个表,结果拉到本地然后单机跑,4C16G的小鸡也能3小时呼呼啦啦处理完。换成全Spark后,查表要消耗500C 6000G,查表要接近2小时,然后处理要7个小时,最后因为超时执行失败。
  • 训练网络。终于解决了环境问题,不再「import torch」花3分钟、从启动到跑到DataLoader要20分钟了。于是进展得还算……还算顺利吧。把视觉分支和文本分支都换成了大模型预训练过的Weights,然后发现性能没有提升。——emm,好的吧。
  • 同事说是输入图片大小的问题。本来想「重新跑一遍就好了」,后来说需要把数据重新打包一下,因为「之前打包为了省地方,就把图片给缩放到徐晓的那个尺寸了」。所以当实际用起来的时候明,因为图片大小和Pre-train weighs尺度不匹配,所以直接报错了。

还生成了一大堆OCR的训练数据

  • 运营提来个需求,说希望支持Hebrew。好家伙,又是一种从右到左的文本,而且需求比较小众。
  • 本来《如何做OCR数据生成》总结都写好了,想着照着做就是了。
  • 首先尝试自己的第二版代码,由于没判断RTL所以生成效果上会有问题。
  • 然后尝试自己的第一版代码,发现报错,好像是不能获取playwright不能获取Chrome的Driver——明明此前一点事儿都没有呢。查了半天没啥结果,放弃。
  • 那么就去开发机上搞吧。然后发现报另外一个错
  • 那么就试试开源的吧。可以说没一个能用的:要么不支持RTL,要么跑例子就直接保存。找运营确认了好久,才确认「生成的东西全部颠倒了」,意思就是原本是「Hello!」但生成出来的是「!olleH」。
  • 继续换回Mac,换回自己的代码第一版,然后重建一下conda环境就好了。然后在本地mac上跑数据生成。可以说这是我第一次自己把MacBook Pro M2的风扇用转过。

天天都好累。

早睡,早睡,早睡!


评论

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注