仏教学の電子化の現状と問題点

このエッセイは2001年5月に開催された第17回韓日国際仏教文化学術会議(韓国・圓光大学校)に於ける発表の要旨である。

佛教大学文学部教授  小野田 俊蔵 
  1. 論文データベース
  2. 電子仏典
  3. 学問上の倫理と問題点

1. 論文データベース

「インド学仏教学論文データベース」

日本で公表された仏教学関係の論文を集めた論文データベースが 日本印度学仏教学会データベースセンター JAIBS Database Center  http://www.inbuds.net/ から公開されている。検索には相場徹氏の「印仏検」 http://www.vacia.is.tohoku.ac.jp/cgi-bin/ibsis?key が便利である。

オーストラリア国立大学のResearch School of Pacific and Asian Studies がホストをしている「Asian Studies WWW Virtual Library」 http://coombs.anu.edu.au/WWWVLPages/WhatsNewWWW/regasia.html や台湾大學佛學研究中心の「Digital Buddhist Library and Museum」 http://ccbs.ntu.edu.tw/   http://sino-sv3.sino.uni-heidelberg.de/e-CBS.htm  からも多くの書誌情報が得られる。

2. 電子仏典

漢字仏典

(大正新脩大蔵経)

周知の様に、大正蔵全体の電子化については、二種類のプロジェクトが大藏出版の許可の下でデータ交換や作業協力等をしながら進行している。(補注a)

先ず日本印度学仏教学会の「SAT(大正新脩大蔵経テキストデータベース)」 http://www.l.u-tokyo.ac.jp/~sat/ であり、もう一つは中華電子佛典協會によるCBETA  http://ccbs.ntu.edu.tw/cbeta/ である。外字処理法や文字コード (1) などで違いはあるものの、仕事としては同じ主旨のものと言える。

CBETA は大正蔵第一巻から第55巻までと第85巻の計56巻の電子化を目標としているが、SAT は第56巻から第84巻までの日本撰述部も電子化する予定と聞く。

尚、両者にアクセスするには、師茂樹氏の「Index of Electronic Buddhist Texts 」 http://www.ya.sakura.ne.jp/~moro/ebt_index/index.html が便利である。

(高麗大蔵経)

電子テキスト版「高麗大蔵経」は1996年に試作的な CD-ROM が公開された。しかし同じ字を異体字とみなして外字フォントで何十字にも区別してしまったため、問題が指摘されていた。その問題点を解決すべく高麗大蔵経研究所は、三万数千字の異体字が入った版と、大幅に統合した標準漢字版との二種で改訂を施している。(2) 新しい版は、東国大学校情報産業大学コンピュータ工学部のスタッフの協力の下で、Unicode(UCS-2)をベースにしつつ異体字情報も盛り込み、さらにWindows 専用のブラウザで閲覧と検索を可能にして、1999年の EBTI(「Proceedings」 http://pnclink.org/events-report/1999/Proceedings/ )で発表された。

(聖語蔵)

大正新脩大蔵経の校訂本の一つであった正倉院の聖語蔵も、画像版として電子化されている。「宮内庁正倉院事務所所蔵聖語蔵経巻」。編集は宮内庁正倉院事務所、監修は高崎直道、築島裕、皆川完一、発行と発売は丸善、第1期の隋・唐経篇(243巻)CD-ROM 22枚は2000年5月に刊行された。

この他にも、中國數字図書館  http://www.d-library.com.cn/ に、中華大藏經の画像データベースが存在する。

個別レヴェルでは「瑜伽行思想研究会」 http://www.edu.nagasaki-u.ac.jp/private/yugagyo/ の漢訳データベースに『瑜伽師地論』『阿毘達磨大毘婆沙論』のデータがある。

また、『大阿弥陀経』『無量清浄平等覚経』『大宝積経無量寿如来会』『大乗無量寿荘厳経』に関しては、佛教大学の安達俊英氏ホームページ「報恩蔵」 http://www.bukkyo-u.ac.jp/mmc01/adachi/index.html からダウンロード出来る。

後述するように「天台電子仏典CD2」には『妙法蓮華経』等が含まれている。

西蔵語仏典

チベット語仏典の電子データ化はACIP (Asian Classics Input Project)  http://www.asianclassics.org/ の努力で進められてきた。公開配付されている CD-ROMはすでに Release IV となっている。オンライン上の公開は「Asian Classics Input Project」 http://www.asianclassics.org/download/texts.html で行なわれており、大蔵経に含まれないチベット撰述の蔵外文献もある。

画像データとしては、高野山大学所蔵のデルゲ版のカンギュル(経部)とテンギュル(論疏部)が、Windows 上で当該の経論典の画像ファイルを引き出せるシステムと共に、CD-ROM 53 枚で発売されている。(高野山大学附属高野山図書館/小林写真工業「デルゲ版西蔵大蔵経 Alchemy Search」)

また最近、ジーン・スミス(Gene Smith) 氏が中心となってPDFを使った画像データ「Tibetan Buddhist Resource Centre CD Sampler #1」が同センター  http://www.tbrc.org/ から配付された。更に、多くの西蔵語仏典を所蔵する大谷大学や東北大学でもチベット語仏典電子化の計画が進んでいると聞き及ぶ。

膨大な蔵外文献の検索に大変便利なデータベースが完成し公開されている。東洋文庫の福田洋一氏による「PL480 マイクロフィッシュ版チベット語文献オンライン検索」 http://www.toyo-bunko.or.jp/Tibetan/PL480Query.html である。東洋文庫からはこれとは別に「ツォンカパ(Tsong kha pa)全書」や「トゥカン(Thu'u bkwang)宗義書」等の科段を検索できる「The Toyo Bunko Multilingual Database CD」(近々、ミパム(Mi 'pham)やロウォケンチェン(Glo bo mkhan chen)の作品を含む「Release II」が提供されると聞く)が公刊されている。その一部はオンライン上「Tibetan Texts & Database」 http://www.toyo-bunko.or.jp/Tibetan/tibetan_resouces/index.html でも公開されている。

梵語仏典

「Sanskrit Buddhist Text Input Project」

米国カリフォルニア大学のバークレー校「佛學研究中心 Berkeley Buddhist Research Center」のランカスターLancaster 教授が中心となっているプロジェクトで現在進行中。すでにデータ化された典籍のリストは同センターの http://ishi.lib.berkeley.edu/buddhist/bbrc/sanskrit_input.html にある。

また、この分野では韓国の李鐘徹氏によるthe SDICTP Project (The Sanskrit Dictionary and Indian Classics Translation Project)がすでに多くの典籍を入力済みで、李鐘徹氏によるそのデータは カリフォルニアのランカスター教授に渡され、近い将来に CD-ROM 化される予定と聞く。1999年の電子仏典利用に関する専門学会EBTI (Electronic Buddhist Text Initiative)  http://www.iijnet.or.jp/iriz/irizhtml/ebti/ebtie.htm で発表された李鐘徹氏(3) 自身によるプロジェクトの概要はネット上 http://pnclink.org/events-report/1999/Proceedings/lee-jc.pdf で公開されている。

その他の種々の入力プロジェクトを思い付くまま列記してみると、 「Dharmakirti E-text」 http://www.logos.tsukuba.ac.jp/~nagasaki/dharmakirti/e-text.html (筑波大学小野基氏によるダルマキールティの電子テキスト)「Buddhist Sanskrit」(4)   http://titus.uni-frankfurt.de/texte/texte2.htm#buskt「Abhisamayalamkara of Maitreyanathaya」(5)  http://online.anu.edu.au/asianstudies/ahcen/coseru/abhisamaya.html「The Data of the Abhisamacarika-Dharma」(6)  http://www.linkclub.or.jp/~s-koshin/AsDhIndE.htm (『大正大学綜合佛教研究所年報』に発表されたものをそのまま PDF にしたもので、検索等が可能)。また、仏典以外のものも含まれるが大谷探検隊が持ち帰った中央アジアの古写本を画像で提供する「龍谷大学古典籍情報システム」 http://www433.elec.ryukoku.ac.jp/Komon/index.html がある。

巴利語仏典 (7) 

「BUDSIR for WINDOWS and BUDSIR in Thai Translation Version (Buddhist Scriptures Information Retrieval」

タイのバンコクにあるマヒドル大学で作られたCDで一般にはマヒドル版と呼ばれるものである。タイ王室版と呼称されるシャム版を使った三蔵45冊とマハーチュラロンコン版を中心にしたアッタカター 55冊が含まれている。

「The Chattha Sangayana Tripitaka CD ROM」

Vipassana Research Institute http://www.tipitaka.org/ が出しているCD。最新のものはVersion(3.0)。ビルマ(ミャンマー)第六結集版を底本にして作成されたもの。

「ダンマカーヤ版CD」(Pali TextVersion 2.0[仮名])

Dhammakaya Foundation (タイ)が出しているCD。PTS版をCD-ROM化したもので現在サンプル版がリリース中である。Visuddimagga/Samantapasadika/ Jataka atthakatha/ Milinda-panha 等も入力されており、画面上の各単語からPTSの辞書が検索できるという。

禅籍

「花園大学国際禅学研究所(IRIZ)電子テキスト」

電子テキストを昔から扱ってきた同研究所 http://www.iijnet.or.jp/iriz/ は「ZenBaseCD1」で有名となったが、その後もデータは蓄積されそれらは公開されている。底本や校正に関する注記もあり利用する研究者からは信頼があつい。外字は台湾の CNS コードを使った方式。

「禅文化研究所(禅学基本データベース[Z.D.B.])」

禅文化研究所  http://www.zenbunka.or.jp/10index/zdb_home.htm が発行した「基本典籍叢刊」や「善本覆刻叢書」を底本として電子テキストが公開されている。外字表記方式は、SATと同じ方式を採っている。

その他禅籍としては以下の諸典がデータ化されている。『正法眼藏』 http://www.shomonji.or.jp/zazen/genzoug.htm『正法眼藏隨聞記』 http://www.bekkoame.ne.jp/i/media/library1/zuimon.html『喫茶養生記』(栄西) http://perso.wanadoo.fr/ep.japon/kissor.htm

浄土宗・浄土真宗系

「デジタル法然上人全集」(CD-ROM)

浄土宗教学院から1999年に刊行された。『選択本願念仏集』及び教書を廬山寺本・延応版・往生院本からの画像データとテキスト入力されたデータとを相互に検索対照出来るようにしたもの。カラーで画像入力された朱点入りの写本の情報は貴重である。オンライン化の計画も現在進められている。

法然上人の御法語に関しては、「古朴堂」と題されるホームページに私家版のデータ  http://www1.plala.or.jp/kobokudo/hou/q_mokuji.html  があるが、使用文献や精度については確認されていない。

「釈浄土群疑論」(CD-ROM)

村上真瑞氏によって入力されたテキストファイル及び寛永版・元徳版等の画像ファイルを含む。

浄土真宗関係では、「浄土真宗聖典 七祖篇(註釈版)」が寺子屋ネット(蓮浄寺中島正思氏) http://www.terakoya.com/index.html で公開されている。また電子ブック版による「浄土真宗聖典註釈版」(『教行信証』などの親鸞聖人の著作類、蓮如上人の『御文章』や『歎異抄』などを含む)が本願寺出版社から出版されたのは1995年であるが、電子ブック専用のリーダーが必要で互換性に乏しい。

天台宗日蓮宗関係

「天台電子佛典CD2」[CD1を内包]

天台宗典籍編纂所  http://www.biwa.ne.jp/~namu007/index.htm  から刊行された中国天台初期文献(陳・隋・唐)81書目のデータ。『妙法蓮華経』『涅槃経』『金光明経』『梵網経』等を含む。

「立正日蓮データベース」

日蓮上人遺文の鎌倉版を画像ファイルに収めたCD-ROM。日蓮上人御遺文辞典も収録されている。(8) 

3. 学問上の倫理と問題点

書誌(論文)情報のデータベースや画像データによる写本の復刻は、従来行なわれて来た研究技法の延長線上に位置付けることが可能であるが、近年進められて来た電子仏典や論文本体のインターネット上での公開にはそれとは別の利点と欠点も見受けられる。

先ずデータ加工途上での精度の問題である。画像データとは違い入力が完全に機械的に行なえる現状ではないので、誤記は必ず存在する。入力の効率化と人件費の問題は最近ではよく研究者の間で話題になる。校正作業による方法と複数の入力を機械的に突き合わせる方法が一般に採られるが、それでも完璧という訳にはいかないのである。無論、かつての刊本でも誤字が存在しないわけではない。いにしえの昔には、書写生による書写が仏典の拡がりを支え、また正確に書写するそのこと自体が「功徳」でもあった。インターネット上のデータからコピーして印刷したり複写したりする行為が仏典書写の「功徳」にあたるのかどうかは分からないが、電子仏典が抱える問題は、小さな誤字でもその誤りが気付かれないまま拡がっていく率は格段に高くなるという点である。このような事は想像したくないが、故意に経論典に「手が加えられる」事も可能性としてはある。カルト集団によるデータの破壊や改ざんあるいは「新たな偽経の創作」を許さないための対策が必要であろう。公開された後に校正作業が行なわれる場合も意図こそ違うものの類似の状況を生む。更新情報が徹底されない時にはそれを二次的に利用した研究に重大な影響を与えかねない。印刷媒体とは違って、インターネット上で提供されるデータは一日に幾度となく更新することが出来るのである。(9) 

また研究者の作業の効率が上がるのは歓迎される事態ではあるが、書誌情報がインターネット上で簡単に手に入るという事は、逆にリファレンスが実際には参照されずに論文上に現われても容易には見抜けないという事を可能性として持つ。また論文本体に関しても電子データ化された原稿や完成論文から無断引用してきた文章を加工した場合にそれがどの程度オリジナルであるのかは簡単には判断出来ないであろう。(10) アカデミズムが内部崩壊する可能性を十分に含むのである。倫理を確立する必要もあろうし、反則行為を発見するための手だても開発する必要があろう。その技術は別の研究をも可能にする。つまり歴史上の著名な学僧が過去のどの論書を参照し引用したのか、あるいは孫引きしたのか?あるいは、同じ著者による複数の著書の著述順序や推考の跡をたどる研究などは、データの分析を上記の方法を応用して行なえば、今までよりも容易にそれが可能となる。複数の文献の用語を計量的に分析して形容詞等の使われ方からその著者や訳者を特定する、あるいは推定をする研究も進展するであろう。

鈴木隆泰氏(東京大学東洋文化研究所附属東洋学研究情報センター)をプロジェクト代表とする Tibetan-Sanskrit 構文対照電子辞書プロジェクト(eDic) http://www.info.ioc.u-tokyo.ac.jp/suzuki/edic/ の活動はまた、今後の新しい研究方法を示唆するもので興味深い。試験公開されているものを見ると『法華経』を利用した構文レヴェルでの対照電子辞書であるが、目指すものは、「散逸した大乗経典のサンスクリット原典をチベット訳経典をもとに構文レベルで復元すること」にあるという。(11) プロジェクトが進行し、研究の可能性が進展することを心から希望するが、復元された梵本が研究レヴェルから離れて独り立ちすることもあるだろう。法然上人の『一枚起請文』の還梵(梵作?)をした研究者も曾ていたが、我々はこのような試みがどのような功と罪があるのかを十分に検討しなくてはならない。

註記

(補註a) 台湾の蕭鎮国氏が独力で入力された大正新修大蔵経のCD-ROM (Big-5)が存在する。大藏出版との版権の関係等詳細は明らかではない。

(1) 漢字のコードとしては以下のものが一般的である。GB コード(GB 2312-80)「国家標準信息情報交換用漢字編碼字符集」(1981年に制定された、漢字6,763字を含む7,445文字のセットで、中華人民共和国を中心とする地域で使われている。)KSコード(KS C 5601-1992)(韓国の文字セットの中の漢字を表す場合にはこのコードを使う。KSC にはハングル2,350字、漢字4,888字など8,224文字が含まれる。)Big5コード (1984年に台湾の情報産業研究所が制定したもの。漢字13,053字を含む13,523文字のセット)である。仏典で使われることはBig5より少ないが台湾の経済部中央標準局が公布した文字セット規格のCNS(CNS 11643-1992)もある。

(2) 加藤弘一「電子テキストの海へ――大蔵経テキストデータベース研究会石井公成氏&師茂樹氏に聞く」 http://www.horagai.com/www/moji/int/sat.htm  ; ウルス・アップ「「高麗大蔵経入力計画」探訪」 http://www.iijnet.or.jp/iriz/irizhtml/ebti/samsungj.htm) ; 高麗大蔵経研究所  http://www.sutra.re.kr/ 

(3) 李鐘徹氏は今年7月1日午後に東大で行われる日本印度学仏教学会大会のコンピュータ利用シンポジウムで報告をされる予定である。

(4) TITUS(Thesaurus Indogermanischer Text- und Sprachmaterialien) (「HTML version (UTF-8)」「WordCruncher version」) http://titus.uni-frankfurt.de/ 

(5) sparsabhumi http://www.anu.edu.au/asianstudies/ahcen/coseru/ 

(6) 大正大学綜合佛教研究所  http://www.sobutsu.org/ 

(7) この項目の情報は野中俊介氏による[国際仏教徒協会東京事務所」 http://homepage1.nifty.com/sojusha/newpage2.htm  及び佛教大学の山極伸之氏から得た。

(8) 日蓮聖人のご遺文の一部(「法華経信行妙典」に基づくもの)はまた、『妙法蓮華経』のデータと共に「ロータス」と題するページ http://www.ceres.dti.ne.jp/~kosho/ の中で公開されている http://www.ceres.dti.ne.jp/~kosho/kyo_001.html#top が、学術的な関心に基づくものではない。

(9) ネット文献引用のガイドライン等については「ネット文献の引用方法について――学術資源としてのネットの可能性――」 http://www.ne.jp/asahi/coffee/house/ARG/compass-028.html を参照されたい。

(10) インターネットの学術発表における著作権と優先権及びその他の一般的な問題点について村瀬澄夫・村瀬さな子両氏による論考がある「インターネットによる学術発表の著作権と優先権」 http://www.ne.jp/asahi/coffee/house/ARG/rerecord-021.html 

(11) 具体的に何を構文レヴェルでの対照というのかということについては、 http://www.info.ioc.u-tokyo.ac.jp/suzuki/edic/eDic.txt あるいは http://www.vacia.is.tohoku.ac.jp/member/aiba/project/edic/pr/document/20001.ioc/ に実例が示される。チベット訳からの還梵や還漢の試みはしかしコンピューターを使わずに行なわれた前例もある。例えば、「Bhavanakrama」を還梵したBibliotheca Indo-Tibetica IX(1985)の例、あるいは稲葉正就「圓測・解深密経疏の散逸部分の漢文訳」『大谷大学研究年報24号』等。

付記 この報告を纏めるにあたって多くの情報を沢山の方から頂きました。ネット上から得られる情報については出来る限り本文や註記で言及しましたが、その他全般に亘って、山極伸之氏、工藤順之氏、兼岩和広氏、清水和広氏他の諸氏から御教示をいただきました。記して感謝いたします。