分类: 程序猿
-
筛选和管理字体的一些经验
做OCR数据合成需要三个条件,字体,语料,背景图。之前闹过一段字体荒,只有几百个字体,生成出来的效果比较单一,…
-
读取Hive落盘文件
工作中查Hive标有一些限制。为了绕过限制,可以将数据直接Dump到HDFS里。但是这样做会导致查出来一大堆文…
-
读取带旋转信息的图片
EXIF信息真好,EXIF信息真烦
-
全角字符转半角字符
工作中很多时候需要将全角字符转换成半角字符。之前一直处理不好。最近搞出来了个还算好用的方法。
-
将博客迁移到Docker上
这两年也就春节这几天有工夫折腾一下自己的博客。
-
PyTorch如何使用分布式训练
前两天为了多占几个机器多占几块卡,让程序跑得更快一点,踩了一下分布式训练的坑。
-
Mac下批量Word转PDF
Pandoc多好用啊~但是Pandoc只支持docx,不支持doc。Win下这样的工具都是收费的,比较坑。于是…
-
一个图片服务脚本
Python自带了一个很简单的HTTP Server,就是python -m http.server 8000…
-
LibSVM C++ 版本用法
强攻了一周,总算放弃了。
-
OpenCV中HoG描述子长度计算
之前只管用,这次算了算。算了好久,终于搞定啦。