UTF-8

修复 MySQL 编码问题

有个疑似 OCD 患者最近抽风升级了一下 MySQL 数据库，然后发现 blog 里面全都变成了乱码。

那乱码的模式一看就是把 utf8 直接扔进了 latin1 的数据库，一看 SHOW CREATE TABLE mt_entry 发现果然如此。

阅读全文…( 本文约 265 字，阅读大致需要 1 分钟 )

FreeBSD简体中文文档改为采用UTF-8编码

2013-11-14 08:51 | Development | #FreeBSD | #documentation | #UTF-8 | #i18n | #l10n

早期 FreeBSD 文档采用 jadetex 等的工具集，对 UTF-8 的支持不好。最近， Gabor 等人完成了将工具集换成 TeX Live、Apache FOP，并使用 DocBook 5.0 的工作，所以趁今天编译代码的空挡，我把 FreeBSD 简体中文文档全部换成了 UTF-8 编码。

阅读全文…( 本文约 503 字，阅读大致需要 2 分钟 )

记一笔，关于 syslogd

syslogd 的 -8 参数可以让汉字通过。以下摘自 manual page：

1
2
3
4
5
6
     -8      Tells syslogd not to interfere with 8-bit data.  Normally syslogd
             will replace C1 control characters (ISO 8859 and Unicode
             characters) with their "M-x" equivalent.  Note, this option does
             not change the way syslogd alters control characters (see
             iscntrl(3)).  They will always be replaced with their "^x" equiv‐
             alent.

不过这事有点坑人，为啥默认不 -8 呢？出于安全方面的原因吗？差点就开始改代码了……

参与评论

如何：转换旧式编码的MySQL数据库到UTF-8

2009-03-26 15:23 | Development | #convert | #i18n | #MySQL | #unicode | #utf-8

最近帮公司的一个客户做了一个数据库迁移，客户声称数据是 utf-8 的，然而在使用过程中出现了许多乱码，检查发现数据并非 utf-8，而是 utf-8 编码之后的 big5，而排序方式更是混乱不堪的默认的utf8-swedian-ci。

MySQL的国际化支持很差。MySQL从 4.1 版本开始大刀阔斧地进行了不兼容的改动，简单地说，这些改动让相当多的操作默认以UTF-8进行，然而这会给旧的应用程序带来很多问题。许多文献推荐使用 SET CHARACTER SET 作为 workaround，尽管这能够解决一些问题，但这种做法本质上会导致 MySQL 进行额外的转换，因此并不是十分理想。

阅读全文…( 本文约 831 字，阅读大致需要 2 分钟 )