文字コードの勉強をしよう

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)

 オープンソースカンファレンス2010 Kansai@Kobeで見つけた書籍です。
 中国語や韓国語と日本語をテキストファイルで混在しようとすると大変です。MS社のWordやWindows Serverなどを使えば比較的文字コード問題は起こらないのですが、世の中、普通はUNIX系のサーバですので文字コード問題は必ず起こります。
 そこでこの本で勉強することにしました。

【詳細目次】
■第1章 文字とコンピュータ
1.1 コンピュータで文字を扱う基本
1.2 文字を符号化するということ
1.3 文字集合と符号化文字集合
1.4 制御文字 ――文字ではない文字
1.5 文字コードはなぜ複雑になるのか
1.6 まとめ
■第2章 文字コードの変遷
2.1 最もシンプルな文字コード ――ASCII、ISO/IEC 646
2.2 文字コードの構造と拡張方法を定める ――ISO/IEC 2022
2.3 2バイト符号化文字集合の実用化 ――JIS X 0208、各種符号化方式
2.4 1バイト符号化文字集合の広がり ――ISO/IEC 8859、Latin-1
2.5 国際符号化文字集合の模索と成立 ――Unicode、ISO/IEC 10646
2.6 まとめ
■第3章 代表的な符号化文字集合
3.1 ASCIIとISO/IEC 646 ――最も基本的な1バイト文字集合
3.2 JIS X 0201 ――ラテン文字と片仮名の1バイト文字集合
3.3 JIS X 0208 ――日本の最も基本的な2バイト文字集合
3.4 JIS X 0212 ――補助漢字
3.5 JIS X 0213 ――漢字第3・第4水準への拡張
3.6 ISO/IEC 8859シリーズ ――欧米で広く使われる1バイト符号化文字集合
3.7 UnicodeとISO/IEC 10646 ――国際符号化文字集合
■第4章 代表的な文字符号化方式
4.1 JIS X 0201の符号化方式
4.2 JIS X 0208の符号化方式
4.3 Unicodeの符号化方式
■第5章 文字コードの変換と判別
5.1 コード変換とは
5.2 変換の実際 ――変換における考え方
5.3 文字コードの自動判別
5.4 まとめ
■第6章 インターネットと文字コード
6.1 電子メールと文字コード
6.2 Webと文字コード
6.3 まとめ
■第7章 プログラミング言語と文字コード
7.1 Java ――内部処理をUnicodeで行う
7.2 Ruby 1.8 ――シンプルな日本語化
7.3 Ruby 1.9 ――CSI方式で多様な文字コードを処理
7.4 まとめ
■第8章 はまりやすい落とし穴とその対処
8.1 トラブル調査の必須工具 ――16進ダンプツール
8.2 文字化け
8.3 改行コード
8.4 「全角・半角」問題
8.5 円記号問題
8.6 波ダッシュ問題
8.7 まとめ
■Appendix
A.1 ISO/IEC 2022のもう少しだけ詳しい説明
A.2 JIS X 0213の符号化方式
A.3 諸外国・地域の文字コード概説
A.4 Unicodeの諸問題
A.5 EmacsとSKKによるJIS2004の活用 ――本書執筆の舞台裏
A.6 規格の入手・閲覧方法ならびに参考文献

【参考】
Amazon.co.jp: CJKV日中韓越情報処理: ケン ランディ, Ken Lunde, 小松 章, 逆井 克己: 本

【多くの留学生がいるKCGIへ入学しよう】
京都情報大学院大学 | 入学説明会
京都情報大学院大学 | 説明会申し込みをしていただきますと、しっかりとご相談にのることができます。

comments

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

*