如何使用 SyhthText 合成自己的数据

OCR 标注贵,所以我们需要「自己造数据」,即数据合成。数据合成的原料是「字体文件、没有字的背景图、文本语料」,过程是「用某种字体,将某些文字渲染在背景图上」。合成的目标是「合成数据和目标数据看起来要尽量接近,比较像」。

在「场景文本」方面,SynText 是一个传说中做得还不错的文本合成工具。那么就来试一试,合成一点自己的数据。

先说结论:生成出来的东西不能用。建议放弃。

继续阅读如何使用 SyhthText 合成自己的数据

重写了一下 ImageServer 小工具

做图像的,难免天天要看大量的图,一张一张点开看十分麻烦。之前组里面有个小工具,可以在浏览器里面将一整个文件夹的图片都展示出来,一目百图,并且还可以用这个 Trick 从服务器上快速下载东西,比较好用。之后自己改了一个版本,然后去年清明学 Go 的时候又用 Go 写了一个版本。

随着需求不断增多,原来的 Go 版本已经不太够用了。今年五一,正好重写一遍。

继续阅读重写了一下 ImageServer 小工具

Mac 外接键盘 简单键位更改

在家办公,桌子椅子键盘显示器都是问题。公司只有一把 HHKB,键盘用着很舒服;去年把用了两年喜新厌旧淘汰下来的 NIZ 82 键静电容给卖掉了,家里就只剩下一把用了 6 年的阿米洛 VA87MC 青轴了(还不是无线的)。但是我发现我已经完全不会用「正常」的 Windows 键盘了😂

继续阅读 Mac 外接键盘 简单键位更改