それこそ国会図書館みたいな膨大な歴史的文献を持っている所の情報をデータ整形して食わせたら、わざわざ謎の古い本を引っ張ってこなくても必要な情報にすぐアクセスできるというロマンたっぷりな感じの未来も実現できそうなのだ。
Conversation
Notices
-
DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 20:00:59 JST DozingCat :vivaldi_gray: -
なかはらいちろう (lithium03@mastodon.lithium03.info)'s status on Saturday, 16-Sep-2023 20:05:10 JST なかはらいちろう @DozingCat 国会図書館もスキャン計画はあるようですね。それを入れる方のAIはまだですが
-
DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 20:05:10 JST DozingCat :vivaldi_gray: @lithium03 まずは過去の文献をデジタルコレクションとして国民がWeb上で古い文献を見れるようにするところからですね。設備のほうにお金がなかなか回ってこなくて、今ある設備フル稼働で順次電子化が進んでいるようです。見るからに以前と比べてNDLデジコレで見れる文献が増えました。
そこから先もしまだAIが話題に上っているならそういうことも実現してほしいと思います。これこそ著作権法的なアレコレがあるので、日本では国会図書館以外そういうことができなさそうなので……。文書の保存も大切ですが、それを活用するという側面にも行動が繋がっていけば良いなと思っています。 -
なかはらいちろう (lithium03@mastodon.lithium03.info)'s status on Saturday, 16-Sep-2023 20:13:27 JST なかはらいちろう @DozingCat それこそせっかく改正した著作権法があるから、バリバリAIに学習させまくったらいいのに、とは思います。
なおGPUが売り切れている模様 -
DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 20:13:27 JST DozingCat :vivaldi_gray: @lithium03 こういう活動こそ人類が過去歩んできた歴史や教訓を次代に伝えることだと思うんですよね。せっかくたくさんの文献を集めたのだし色々な方法で活用してほしい…。
AIに学習させるにも先立つものがががが -
なかはらいちろう (lithium03@mastodon.lithium03.info)'s status on Saturday, 16-Sep-2023 20:17:24 JST なかはらいちろう @DozingCat いまGPU枯渇してるので、金積んでもコネないと取って来れなさそう。
ABCIもA100の待ち行列がすごくてジョブ全く入らない -
DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 20:17:24 JST DozingCat :vivaldi_gray: @lithium03 そんな混雑してるんですね…。AI需要恐ろしい
でも、いざ国が動くならどこよりも優先してリソース回してくれるはず……! -
なかはらいちろう (lithium03@mastodon.lithium03.info)'s status on Saturday, 16-Sep-2023 20:24:08 JST なかはらいちろう @DozingCat ここ2−3ヶ月やばいです。A100を借りれるところはどこも満員になってて、Google Cloudでも無理になってる
-
DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 20:24:08 JST DozingCat :vivaldi_gray: @lithium03 一体みなさん何に使ってるんでしょうね。すごいなぁ
-
なかはらいちろう (lithium03@mastodon.lithium03.info)'s status on Saturday, 16-Sep-2023 20:27:45 JST なかはらいちろう @DozingCat ちょっと前までは、ここまでではなかったのに…
何が出たんです? -
DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 20:27:45 JST DozingCat :vivaldi_gray: @lithium03 え、そうだったんですか!?AIの盛り上がりは数年前からあった感がありますが、ここまで人気なのは最近の話なんですね。何があったんでしょう……さっぱり
-
なかはらいちろう (lithium03@mastodon.lithium03.info)'s status on Saturday, 16-Sep-2023 20:39:16 JST なかはらいちろう @DozingCat 1年前は、Google CloudでエコノミーモードでA100借りれた。
数ヶ月前は、通常モードならA100借りれた。今はそもそも取れない
ABCIのA100もそれと同じくらいの割合に混んでるので、何かモデルいいの出たんでしょうかね -
DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 20:39:16 JST DozingCat :vivaldi_gray: @lithium03 ここ1年以内とかそういうレベルの話なんですね。いつまでこれが続くんでしょうねぇ
-
なかはらいちろう (lithium03@mastodon.lithium03.info)'s status on Saturday, 16-Sep-2023 20:44:57 JST なかはらいちろう @DozingCat H100が溢れてくれればw
-
DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 20:44:57 JST DozingCat :vivaldi_gray: @lithium03 実現可能性のほどはw
-
no_name (sevenclans@mstdn.jp)'s status on Saturday, 16-Sep-2023 22:43:04 JST no_name 私は必要な文献をすべて引っ張ってこれて、内容をデジタル検索できるようにして貰えたら御の字ですが、Alに聞けばそれで済むようにというのはなかなか難しいんじゃないですかね。
機械はまだ言うほど崩し字読めてませんし、古典文法も分かってないと内容までは読めません。何より量も膨大な一方で、すべての文献が国会図書館に所蔵されている訳でもなく、多くは研究途上で、殆ど手つかずのものもまだまだあるんじゃないでしょうか。それをAlが答えてしまうとなると、内容がちょっと心配ですね。
それでも模索していくべきだと思いますし、うまく活用できれば色々と捗るところも出てくるでしょうから楽しみではありますが。
-
DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 22:43:04 JST DozingCat :vivaldi_gray: @sevenclans 確かに一連の作業を全てAIが代替するのは難しいというのは同意できます。
崩し字に関しては機械学習を通じていずれは解読できるようになるでしょう。さし当たっては機械可読データに整形する必要があります。そのために現在国会図書館が取り組んでいるような人間の手による文献の電子化及び文字抽出を行うことが現実的でしょうか。文法に関しては、現在の我々の利用する言語でも不完全性が見え隠れしているのでその点の困難さはありますが、これもそう遠くないうちに解決できると考えます。しかし、文字が認識でき文法を解釈して読めたからと言って学問研究のレベルでそのまま出せるとは考えていません。得られた文献をどう調理するかが学問研究で問われていることですから、研究者独自の切り口を考慮すれば、そこをAIによって、ましてや他の人間が代替することも不可能でしょう。ただ、文献を収集する段階で必要な文献を過不足なく集めたりアタリを付けることに活用できると確信しています。
-