20241221


发布于

|

分类

,

团聚

生活

周末

  • 队友终于结束出差回上海了——那不得好好庆祝一下。
  • 周六一起吃了炸酱面,做了蛋糕,吃了酸菜鱼火锅,周日一起去海马体拍了2024年的纪念照。
  • 还吃了一大堆烤红薯,和饺子。
  • 嗯,周末就这样过去了

做蛋糕

  • 就是想体验一下,没想到做出来意外地好看+好吃。
  • 感觉原料并不贵(一个6英寸的蛋糕原料也就40块钱左右,全贵在奶油上了),就是费功夫。
  • 打蛋器很解压,体验了一下拉花/裱花,蛮好玩的。

海马体拍照

  • 在《圣诞照》和《冬雪夜》二选一,最终选了《冬雪夜》。
  • 大中午过去的,妆造完都快要饿+热晕了。
  • 摄影师不错,在电脑上看预览,都舍不得删……最终100多张只删剩下4张,心痛。
  • 期待成片。

捉襟见肘

  • 原来一个人住房子的时候,一个人住一室一厅的隔断,家里似乎还蛮「宽敞」的。
  • 队友搬过来,啥啥啥都捉襟见肘:两只仓鼠各种囤东西,一室一厅的隔断只剩下了一条小路,甚至交错才能过得去;热水器太小了,洗着洗着水就凉了,第二个人洗要等好久好久;吃饭都没地方摆盘子。
  • 下周末去看房子吧就。

学习和折腾

智能家居

工作

考古

  • 需要把mllm的视觉部分拆出来部署。组里之前的临时方案是把视觉部分再拆成预处理和GPU,这样一整套服务下来,就需要拆成至少5个服务,简直要爆炸。而且更难受的是,由于使用了LlavaNext的切图策略,一张图的特征和多张图的特征不一样,需要单独做缓存。
  • 好好好,那就把预处理和GPU部分合在一起,然后各种加多线程/多进程,让尽可能提高一点点点利用率;然后又找了上古的技术,把GPU部分用高性能推理引擎单独起个RPC进程,外面Python Wrapper调用本机的这个RPC。
  • 还好,整套东西之前做过一次,还算比较顺利。唯一不顺利的是没时间,做的过程中一直被各种事儿打断。

vllm

  • 好几个框架都从TensorRT-LLM转向vllm了——但不得不说,省去一步模型转换,是真的蛮讨喜的。
  • 然后就各种问题:vllm跑LLM的时候默认不支持embedding输入,需要自己hack;输出也不支持所有logits,也需要根据报错反查代码更改配置,然后自己小hack下,做个假的logits出来。更有莫名其妙的OOM……

年终总结

  • 一年好快啊,又要年终总结了。
  • 不过今年似乎需要的文档特别多。LD似乎也稍微走上了形式主义的路子。
  • 特别烦文档,特别烦。

Start of something new.


评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注