2018年12月1日(土)・2日(日)の2日間、東京大学地震研究所にて「人文科学とコンピューターシンポジウム2018」(じんもんこん2018)が開催されました。「総合資料学の創成」事業では、2日目にじんもんこんと総合資料学の共催セッションとして「歴史研究と人文研究のためのデータを学ぶ」を開催しました。本事業では2017年度にも、じんもんこんとの共催セッションを開催していますが、昨年度はデジタルツールを扱ったことを踏まえて、今回のテーマは「歴史研究と人文研究のためのデータ」としました。
昨今、国内外の文化学術機関によって公開資料のオープンデータ化が活発に実施されています。総合資料学が進める事業も博物館資料のデータベース化とそのためのシステム構築を主眼のひとつとしており、学術機関におけるデータの取扱いは、「じんもんこん」の出席者にとっても総合資料学メンバーにとっても関心の高いテーマです。2時間にわたった当日のセッションでは、7つの機関・団体から8名のスピーカーをゲストに迎え、各機関・団体が公開する歴史学・人文学研究に利用可能なデータについて紹介して頂きました。
初の登壇者である国立国会図書館の徳原氏には、国立国会図書館デジタルコレクションについて、特に同コレクションの歴史的音源(れきおん)についてご紹介頂きました。NDLデジタルコレクションにて公開される画像や書誌データについてはすでによく知られています。しかし歴史的音源については、非常に歴史的価値の高いデータを多数収録しているものの、まだまだ認知されていない面がああります。徳原氏には、実際の音声データのデモ再生も交えて収録データの構成や内容について説明して頂きました。
続く橘川氏・小山田氏からは、東京文化財研究所の公開データについてご説明頂きました。東文研は多数のデータベースを公開しているが、今回ご紹介頂いたのは「ガラス乾版データベース」「美術展覧会開催情報」「物故者記事」の3件です。データベースのシステム構成についても説明があり、エンジニア的視点からも興味深い報告でした。
渋沢栄一財団の茂原氏からは、同財団が公開するデジタル版の『渋沢栄一伝記資料』や『実験論語処世談』『渋沢社史データベース』など6件のデータベースについて紹介して頂きました。渋沢財団のデータベースの特徴は、単純な目録情報やフルテキストの提供だけでなく、機械処理による可視化を提供している点です。とりわけ渋沢栄一の関連社名・団体名の変遷を記した遷移図は、歴史学における組織の変遷の可視化に応用できるようにも思われました。
東京国立博物館の村田氏の報告内容は、国立文化財機構の4博物館の収蔵品の横断検索を可能にするシステムColBaseです。ColBaseは極めて先進的な取り組みですが、村田氏はデータの収集・更新や名寄せ、多言語化などのプロセスに様々な課題が残っていることを指摘されました。システムを公開したところで事業を完了とするのではなく、残存する課題を洗い出し、着実にシステムの改善に繋げていく姿勢が感じられました。
東京大学の中村氏には、全国の大学が取り組むIIIF(International Image Interoperability Framework)データの公開について現況をご報告頂きました。デジタルアーカイブのデータ公開形式としてIIIFが注目されたのはここ2〜3年のことですが、予想より急速に普及が進んでいるようです。
青空文庫の世話人を務める大久保ゆう氏には、青空文庫の公開データについてご紹介して頂きました。誰もが知る存在となった青空文庫ですが、最近はパブリックドメイン化した作品をHTML形式でWeb公開するだけでなく、機械処理可能なデータセットとしてGitHub上で公開されています。このため言語学のコーパスとしても利用が進んでいるようです。
最後の登壇者として、当館後藤より「人文科学とコンピュータ研究会」(CH研究会)の関係者によるデータ公開事例についてのレビューがありました。
今回のセッションでご報告頂いた機関・団体の提供するデータは、いずれも高い歴史的価値を有するものです。登壇して頂いたスピーカーの方々に厚く御礼を申し上げます。
2018年12月2日(日)13:30-15:30
会場:東京大学地震研究所 2号館5階第1会議室(C会場)
【プログラム】
- 趣旨説明 後藤真(国立歴史民俗博物館)
- NDLの公開データについて〜歴史的音源を中心に 徳原直子氏(国立国会図書館)
- 東文研の公開データ 橘川英規氏・小山田智寛氏(東京文化財研究所)
- 渋沢栄一記念財団の公開データ 茂原暢氏(渋沢栄一記念財団)
- ColBase 村田良二氏(東京国立博物館)
- 大学が公開するIIIFデータ 中村覚氏(東京大学)
- 青空文庫のデータについて 大久保ゆう氏(青空文庫)
- とくにじんもんこんに関係の深いデータセット概観 後藤・橋本雄太(歴博)