
Unicode 13.0 において大正新脩大蔵経に使用される漢字(UCS外字)329種が符号化されました
2020年3月10日、世界の文字をコンピュータ上で効率的に利用できるようにすることに取り組むユニコード協会が公開した Unicode 13.0 において、大正新脩大蔵経掲載字として当研究会が2015年にIRG会議に提案した329種の漢字がCJK統合漢字拡張Gの一部として符号化されました。これにより、大正新脩大蔵経をはじめとする仏教テクストのコンピュータ上での取り扱いが大きく改善されます。
すでに当研究会の提案により、Unicode 10.0 におけるCJK統合漢字拡張F(以下、拡張F)において、学術団体からの漢字の符号化提案としては世界で初めて、2800種超の大正新脩大蔵経掲載字が符号化されており、SAT大蔵経テキストデータベースやCBETA漢文大蔵経等、国内外の仏教テクストに広く使用されています。今回の329種により、その利便性がさらに高まることになります。内容としては、拡張Fにおいて提案を見送った漢字、及び、慧琳撰一切経音義・希麟撰続一切経音義に使用されている漢字の一部から成ります。なお、この329種の漢字が含まれるCJK統合漢字拡張Gの文字のリストに関しては、以下のURLをご覧ください。SAT研究会による提案文字は、各文字の下部に記された文字番号にSAT-という接頭辞が付与されています。
対応フォントについては、SATが提案したCJK拡張F及びGをまとめたTruTypeフォントをご用意しました。
https://www.unicode.org/charts/PDF/Unicode-13.0/U130-30000.pdf
(SAT提案字の例)
現在、SAT研究会では、IRG会議における漢字符号化の活動に参画を続けつつ、2017年にIRG会議に提案した文字の符号化と、さらなる文字の調査、そして、拡張Fにおいて符号化した情報のエラー修正に取り組んでいます。今後ともご協力のほど、何卒よろしくお願いいたします。
参考:
- 日本・中国・韓国の仏典で用いられてきた外字 2800 字種超が Unicode に収録されました(2017 年 7 月 14 日)
- 下田正弘・永崎研宣編『デジタル学術空間の作り方』文学通信, 2019年. (全文PDF: https://bungaku-report.com/sat.html)
- 王 一凡. OpenCVを利用した活字画像の切り出し-大正新脩大藏經『一切経音義』の活字字形研究に向けて-. 情報処理学会研究報告2015-CH-106(8). pp. 1-4, 2015-05-09.
- 王一凡, 永﨑研宣, 下田正弘. グラフデータベースによる文書リポジトリ統合管理システムの設計. 情報処理学会研究報告2018-CH-117 (8). pp. 1-6, 2018-05-5.