ライブラリアン・コラム

ChatGPTは蔵書検索以外でもっと有効活用して欲しい

榎本 翔

2023年5月

はじめに

2023年5月現在、AIチャットボット“ChatGPT”は、あらゆる分野で影響を与えている。図書館も例外ではなく、ある図書館でこんな事例があったようだ。図書館利用者Aは読みたい本Bがあり、ChatGPTに所蔵状況を尋ねたところ、図書館Cに所蔵があるという情報が提示された。そこで図書館Cを訪問するが、図書館Cに目的とする本はなかった。上記の事例から図書館利用者が、有力な情報検索ツールとしてWikipediaやGoogle以外にもChatGPTを用いる可能性が出てきたことが分かる。本稿では、上記事例をもとにChatGPTと図書館の関係について考察していく。なお、詳しい技術や仕様について、ChatGPTの大元であるGPTInstructGPT等の論文はプレプリント・サーバーであるarXivから原著を読むことができる。

また、本稿の内容および意見は執筆者個人に属し、日本貿易振興機構あるいはアジア経済研究所の公式意見を示すものではない。

図 ChatGPTのロゴ

図 ChatGPTのロゴ
ChatGPTは蔵書検索には向いていない

結論から言えば、ChatGPTは蔵書検索を目的とした用途には向いていない。その理由を簡潔にまとめると以下の3点である。

  1. ChatGPTが事前学習したデータは2021年8月以前のものであるため、2021年9月以降に出版された書籍情報は知らない。
  2. ChatGPTで利用されているモデル、GPT-3の事前学習データは主にクローラーを用いたCommon Crawlというデータセットを加工して使用されており、クローラーが蔵書検索システムによる所蔵情報を把握していない可能性が高い。
  3. インターネット上に用いられる言語は過半数が英語であり、日本の書籍の情報がCommon Crawlに含まれている可能性が低い。

つまり、ChatGPTは日本で最近出版された書籍の所蔵情報を持ち合わせていないのである。仮に回答が得られたとしても、学習データから文法的に問題ない文字列を出力するために、架空の題名や著者名を出力する場合もある。

今後、ChatGPTが新しい学習データの更新頻度を高める可能性や、Google Bardのような別のLLM(Large Language Models)の利用により克服される可能性もある。現に、本記事を執筆中にGPT-4モデルのウェブから新しい学習データを取り込んだ新しいChatGPTのテストが行われているという情報が出ている。国内での取り組みとしては、所蔵情報と組み合わせたチャットで蔵書検索させるという、カーリルによる蔵書検索サポーターの実証実験も行われている。

2023年3月時点では冒頭の図書館利用者AがChatGPTの使い方を誤っていると言われればそれまでである。しかし、筆者にはこの出来事には多くの示唆に富んでいるように見える。

人によっては図書館員よりもAIの方が尋ねやすい

図書館員は所蔵について聞かれたら蔵書検索システムを用いて正確に回答できるし、具体的に読みたい本がない利用者には、色々と質問して主題や媒体等の条件で検索したり、あらかじめ読書案内や新着図書を用意していたりする。

しかし、図書館は世界中のすべての本を取り揃えているわけではないし、所蔵資料への知識は個々の図書館員で異なる。図書館はコンビニエンスストアとは違って24時間開館しているわけでもないし、サービス利用には赴く必要がある。インターネット上で様々な検索サービスやSNSが発達した現在においてはそもそも、ある特定の主題について理解を深めることや小説や文学作品を楽しむうえで、図書館の蔵書を利用することは必須ではない。

一方でChatGPTはデバイスやインターネット等の環境を準備すれば基本的にいつでも利用できるし、回答の背景となるデータ量も十分なものが期待できる。さらに、特定の主題について何も前提知識がない場合も有用である。例えば発展途上国の調べ方について知りたい場合は、蔵書検索で「途上国 調べ方」と入力するよりもGoogleで調べた方が初学者向けの情報は出てくると思われる。さらにChatGPTでは質問や回答のレベルを調整することが可能である。得られた回答についてより詳しく回答を求めたり、理解できなかったりした時はより平易な回答を求めることができる。

ChatGPT(GPT-4)での回答例

画像はChatGPT(GPT-4)での回答例である。
実際にアジア経済研究所所属の研究者が同じ質問に対して回答した結果は
おしえて!知りたい!途上国と社会 第7回 途上国についてどのように調べたらいいですか?(高校2年生)」をご覧いただきたい。

また、利用者の情報欲求によっては人間を相手にしたくない場合も考えられる。学び直しをするうえで子ども向けの本を購入したり図書館で借りたりするのは効果的だが、少し恥ずかしいという思いもある。人に尋ねにくい事項について調べたいこともある。こういった場合に相手がAIなら気兼ねなく聞けるという利点もある。小説や文学作品については、古典で有名なものであればChatGPTはある程度内容を把握した回答が得られ、人間の知識量に依存しない。他にも、ChatGPTに即興で小説を作成させたり、自分が書いた小説の推敲を依頼したりするといった、従来は他人に気軽に頼みづらかったことが実現できる。

もちろん、ChatGPTは万能ではない。前述のとおり蔵書検索を目的としてChatGPTを利用するのは推奨しないし、本の紹介を求めると、図書館に所蔵がないどころか架空の本を紹介されることもある。ChatGPTが参照している学習データが著作権侵害をしている可能性は否定できないため、小説の作成結果が別の文学作品を流用している可能性もあり得る。

ChatGPTを効果的に利用するためには、とりあえず何でも聞いて回答をそのまま利用するのではなく、ChatGPTが適切な回答をできるようにプロンプト(回答を生成するための命令文)を整備し、回答内容を評価して再回答を求めたり、回答結果を推敲し、権利的に問題がないか確認をしたりする必要がある。

おわりに──ChatGPTは蔵書検索以外でもっと有効活用して欲しい

本稿ではChatGPTと図書館の関係について考察し、蔵書検索ではうまく活用できないことを論じた。それは図書館関係においてChatGPTを使うなと言っているのではなく、むしろ逆でもっと有効活用して欲しいと考えている。ChatGPTは文章生成が得意であるため、適切に利用できれば作文の質は向上するように思える。ChatGPTを用いるうえで特に注意しなければならないのは内容の方で、見た目はそれらしきことが書いてあっても事実とは異なる可能性があるため、出力後に人の手で事実の確認や推敲をする必要がある。内容の妥当性や信用性については、既に出版や公開されて再検証可能な情報源の引用や参照により補強できる。

情報源の中立性や多様性、コスト面を考慮すると図書館は有用である。インターネットや書店は競合ではなく最新の情報を補完してくれる存在である。ChatGPTによる補助を受けながら内容の充実を人の手で行うという、知的生産活動や情報行動が促進されれば、生成結果の裏取りのための情報源を求めて結果的に図書館の利用は増えるのである。最初の例で紹介した図書館利用者Aも、ChatGPTで蔵書検索をするという誤った使い方をしたとはいえ、来館した後は別の本を図書館の中で探したのかもしれない。今まで図書館の利用を考えなかった人が、ChatGPTの出現によって、図書館に足を運ぶようになることを願うばかりである。

著者プロフィール

榎本翔(えのもとしょう) アジア経済研究所学術情報センター図書館情報課課員。現在の担当は図書館システムやデジタルアーカイブといったシステム関係。