自動用語抽出は専門分野のコーパスから専門用語を自動的に抽出する技術として位置付けられます。従来、専門用語の抽出は専門家の人手によらねばならず、大変に人手と時間がかかるため up-to-dateな用語辞書が作れないという問題がありました。そこで東京大学情報基盤センター中川裕志教授と横浜国立大学環境情報研究院森辰則研究室は、共同で、与えられた特定分野のコーパスのみの情報から専門用語を特定、抽出するシステムを開発してきました。本システムは、その成果をプログラムとして広く公開するものです。
ここにあげた校章画像情報は,相馬英智さんと佐々木太良さんが,横浜国立大学大学院工学研究科電子情報工学専攻在籍時代にTeXのMETAFONT形式で作成したものです.このファイルを森がMF→PKフォント→PSファイル→PPM形式→GIF形式と変換しました.
大阪市立大学の安倍広多先生が作成されたbunkenhtmlを改造したものです.
bunkenhtmlは,BibTeXの文献リストをHTMLに変換するプログラムでして,BibTeXのスタイルファイル(bstファイル)により,BibTeXの機能をつかって文献リストをHTMLに変換するという,非常にすばらしい着想の下に作成されています.そのために,利用者はbibファイルを普通に管理するだけで済みます.
bunkenhtml-xrefはbunkenhtmlに,森が電子文書へのハイパーリンクを生成する仕組みを追加したものです.また,ほかにもいくつかの変更を加えております.森の発表文献リストはこのbunkenhtml-xrefにより自動生成されています.