研究データを10年守れ! 京都大学が導入した長期保存システムはオンプレとクラウドの“ハイブリッド”が実現の鍵に

» 2018年05月21日 15時00分 公開
[PR/ITmedia]
PR

 「STAP細胞の研究不正」──この数年で、日本国内の大学における重大なインシデントが世間を賑わせたのは記憶に新しい。そういった問題が発生したとき、管理体制を問われる大学側は、研究データを管理、調査、報告できる体制を整えられているだろうか。国の信頼をも揺るぎかねない事態の再発防止策が、各大学や研究機関にとっても大きな課題になっている。

 10学部18大学院を構え、約2万3000人の学生と5000人以上の教職員が在籍する京都大学では、教育および研究利用を目的とした「アカデミッククラウド」と呼ばれる大規模なプライベートクラウドを運用している。これらをはじめとする学内ネットワーク環境の構築と保守、管理および高度な利用や活用に関する研究開発業務を行っているのが、京都大学 情報環境機構および学術情報メディアセンターだ。

photo

 「京都大学では、研究支援のための情報基盤を4年に1度の間隔で更新しています。2016年度の更新では、『学内の研究データをいかに安全かつ確実に保存するか』がテーマの1つでした」──情報環境機構の青木学聡准教授はそう説明する。

photo 京都大学 情報環境機構の青木学聡准教授

 「2014年の夏に、文部科学省から『研究活動における不正行為への対応等に関するガイドライン』が公表され、その後、日本学術会議で「研究データなどの資料は、当該論文等の発表から10年間の保存を原則とする」という指針が示されました。これに伴い、京都大学でも、研究データを安全かつ確実に保存できるようにするには、どのようなシステムが最適なのかという検討を開始しました」(青木准教授)

 同大は基盤更新を機に、研究データの長期保存システムを構築。そのソリューションとして、オラクルが提供するオンプレミスの「Oracle WebCenter Content」とパブリッククラウドである「Oracle Content and Experience Cloud」のハイブリッド構成を採用した。

研究データを安全かつ確実に10年間保存できるシステムの構築を目指した

 大学における研究データの保存は、これまで研究者自身の責任において行われることが一般的であり、京都大学でも同様であった。しかし、研究者が10年もの間、データを安全かつ確実に保存することは現実的に難しい。そこで研究者に代わって大学側がデータの保存環境を整える取り組みを始めた。

 同大では、青木准教授が当時所属していた工学研究科が先導して研究データを保存する仕組みのプロトタイプを自前で構築し、簡易的な研究データ保存システムとして運用を開始した。しかし、研究活動のトータルな支援を目的として全学に展開していくには、要件を満たすシステムを“組織的に”作る必要があった。

 そこで、情報環境機構の梶田将司教授が中心となり、2015年度より次期システム更新に合わせて“本格的な研究データの長期保存システム”の検討を始めた。

photo 京都大学 情報環境機構の梶田将司教授

 「『10年間という長期保存に耐え得る』という要件はあるものの、どれだけの研究データを保存する必要があるのか、見通しの立たないまま始める必要がありました。記憶媒体はコスト面でテープストレージが魅力的でしたが、メンテナンスや長期保存の観点で光ディスクを選択しました」(梶田教授)

 一度限りの書き込みができる光ディスクは、研究データを長期間保存することに向いている。ただし、研究者は引き続きそのデータを利用する必要があり、また将来的にはそのデータを共有、公開する可能性もある。そのために、梶田教授は光ディスクの運用を補完する仕組みが必要だと考えた。

 「仕様の中でまず要件としたのが、データの監査や共有、公開の流れを一元的に管理できるワークフローエンジンを備えていることでした。研究者にはストレージへ自由にアクセスしてもらい、必要なタイミングで研究データを光ディスクへアーカイブして長期間保存します」

 「将来的にはパブリッククラウドのオンラインストレージを活用するかもしれません。パブリッククラウド上のオンラインストレージも活用できれば関係者とのデータのやりとりがスムーズになります。そこで仕様の検討段階では、オンプレミスとパブリッククラウドのハイブリッド構成を意識しました。オンプレミスとパブリッククラウド、それらが連携できれば運用管理もスムーズです」(梶田教授)

photo

オンプレミスとパブリッククラウドのハイブリッド構成

 同大では、研究データの長期保存システムとして、光ディスクアーカイブと連携できるソリューション、そしてオンプレミスとパブリッククラウドのハイブリッド構成を探した。光ディスクアーカイブと連携できるソリューションとして、オラクルのオンプレミス製品である「Oracle WebCenter Content」を導入することに決めた。その後、システムの構築段階において、オラクルよりパブリッククラウドである「Oracle Content and Experience Cloud」と連携すれば、ハイブリッド構成を実現できると提案された。

photo

 「さまざまな製品・ソリューションを比較検討した中、オラクルのソリューションを採択することによりハイブリッド構成を実現することができました。ハイブリッド構成を1つのインタフェースで運用管理できる。それが実現できるベンダーはオラクルだけでした」(梶田教授、青木准教授)

 これらは、2016年の始めにパイロットシステムという形で導入された。「ちょうど同じ時期、京都大学で研究公正を担当する研究推進部から、研究データを保存する仕組みの相談を受けていました。そこで導入、試用を行いながら、並行して仕様書案を作成し、本番システムへ導入が決定したのは2016年7月末のことです」(梶田教授)

 そこから光ディスクアーカイブストレージとの連携、接続などのシステム構築作業を実施。βテストを繰り返し、2017年6月には研究データ保存システムの後継として、Oracle WebCenter Contentによる文書管理システムと、光ディスクアーカイブストレージのサービス提供を部分的に開始。2017年11月には全学向けの新しい研究データ保存システムとして稼働した。

データ保存システムを通じて得られるイノベーションは?

 間もなく本格運用が始まる研究データ保存システムだが、京都大学ではどのような導入効果を見込んでいるのだろうか。

 「もはやデータを保存するという業務は、ユーザーにとって一筋縄でいくものではありません。そうしたユーザーの負担を軽くするということが一番の目標です。研究者は大量の研究データを長期にわたって保存しながら、共同研究者とデータを共有したいと考えています。従来は、研究者が個別にネットワークストレージ(NAS)を導入したり、オンラインストレージを契約したりしていました。しかしそれは、コンプライアンスの観点で研究者に負担を強いるものです」

 「大学が研究データ保存システムを提供し、10年間のデータ保存を担保することは研究者の活動をサポートするだけでなく、何かインシデントが発生した場合のセーフティネットとして機能します」(青木准教授)

 今後は青木准教授が中心となって使い方の提案や使い勝手の改良に取り組み、2017年度内には情報環境機構のサービスとして定着を図る予定だ。構築を主導した梶田教授は、今後の研究データ保存システムの役割に期待を寄せる。

 「当初、研究公正の強化を目的として研究データ保存システムの検討を始めましたが、オープンサイエンスや知財活用なども推進できる情報基盤として活用し、多様な研究領域のデータを融合して新たなイノベーションを創出したいと考えています。今後の知財活用やオープンサイエンスの実現など、新しい研究データ保存システムを通じたアカデミックイノベーションを促進することが、京都大学が目指すところです」(梶田教授)

動画が取得できませんでした

Copyright © ITmedia, Inc. All Rights Reserved.


提供:日本オラクル株式会社
アイティメディア営業企画/制作:ITmedia NEWS編集部/掲載内容有効期限:2018年6月30日