Conversation

Notices

DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 20:00:59 JST DozingCat :vivaldi_gray:

それこそ国会図書館みたいな膨大な歴史的文献を持っている所の情報をデータ整形して食わせたら、わざわざ謎の古い本を引っ張ってこなくても必要な情報にすぐアクセスできるというロマンたっぷりな感じの未来も実現できそうなのだ。

In conversation about a year ago from social.vivaldi.net permalink
- なかはらいちろう (lithium03@mastodon.lithium03.info)'s status on Saturday, 16-Sep-2023 20:05:10 JST なかはらいちろう
  in reply to
  
  @DozingCat 国会図書館もスキャン計画はあるようですね。それを入れる方のAIはまだですが
  
  In conversation about a year ago permalink
- DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 20:05:10 JST DozingCat :vivaldi_gray:
  in reply to
  - なかはらいちろう
  @lithium03 まずは過去の文献をデジタルコレクションとして国民がWeb上で古い文献を見れるようにするところからですね。設備のほうにお金がなかなか回ってこなくて、今ある設備フル稼働で順次電子化が進んでいるようです。見るからに以前と比べてNDLデジコレで見れる文献が増えました。
  そこから先もしまだAIが話題に上っているならそういうことも実現してほしいと思います。これこそ著作権法的なアレコレがあるので、日本では国会図書館以外そういうことができなさそうなので……。文書の保存も大切ですが、それを活用するという側面にも行動が繋がっていけば良いなと思っています。
  
  In conversation about a year ago permalink
- なかはらいちろう (lithium03@mastodon.lithium03.info)'s status on Saturday, 16-Sep-2023 20:13:27 JST なかはらいちろう
  in reply to
  
  @DozingCat それこそせっかく改正した著作権法があるから、バリバリAIに学習させまくったらいいのに、とは思います。
  なおGPUが売り切れている模様
  
  In conversation about a year ago permalink
- DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 20:13:27 JST DozingCat :vivaldi_gray:
  in reply to
  - なかはらいちろう
  @lithium03 こういう活動こそ人類が過去歩んできた歴史や教訓を次代に伝えることだと思うんですよね。せっかくたくさんの文献を集めたのだし色々な方法で活用してほしい…。
  AIに学習させるにも先立つものがががが
  
  In conversation about a year ago permalink
- なかはらいちろう (lithium03@mastodon.lithium03.info)'s status on Saturday, 16-Sep-2023 20:17:24 JST なかはらいちろう
  in reply to
  
  @DozingCat いまGPU枯渇してるので、金積んでもコネないと取って来れなさそう。
  ABCIもA100の待ち行列がすごくてジョブ全く入らない
  
  In conversation about a year ago permalink
- DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 20:17:24 JST DozingCat :vivaldi_gray:
  in reply to
  - なかはらいちろう
  @lithium03 そんな混雑してるんですね…。AI需要恐ろしい
  でも、いざ国が動くならどこよりも優先してリソース回してくれるはず……！
  
  In conversation about a year ago permalink
- なかはらいちろう (lithium03@mastodon.lithium03.info)'s status on Saturday, 16-Sep-2023 20:24:08 JST なかはらいちろう
  in reply to
  
  @DozingCat ここ2−3ヶ月やばいです。A100を借りれるところはどこも満員になってて、Google Cloudでも無理になってる
  
  In conversation about a year ago permalink
- DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 20:24:08 JST DozingCat :vivaldi_gray:
  in reply to
  - なかはらいちろう
  @lithium03 一体みなさん何に使ってるんでしょうね。すごいなぁ
  
  In conversation about a year ago permalink
- なかはらいちろう (lithium03@mastodon.lithium03.info)'s status on Saturday, 16-Sep-2023 20:27:45 JST なかはらいちろう
  in reply to
  
  @DozingCat ちょっと前までは、ここまでではなかったのに…
  何が出たんです？
  
  In conversation about a year ago permalink
- DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 20:27:45 JST DozingCat :vivaldi_gray:
  in reply to
  - なかはらいちろう
  @lithium03 え、そうだったんですか！？AIの盛り上がりは数年前からあった感がありますが、ここまで人気なのは最近の話なんですね。何があったんでしょう……さっぱり
  
  In conversation about a year ago permalink
- なかはらいちろう (lithium03@mastodon.lithium03.info)'s status on Saturday, 16-Sep-2023 20:39:16 JST なかはらいちろう
  in reply to
  
  @DozingCat 1年前は、Google CloudでエコノミーモードでA100借りれた。
  数ヶ月前は、通常モードならA100借りれた。今はそもそも取れない
  ABCIのA100もそれと同じくらいの割合に混んでるので、何かモデルいいの出たんでしょうかね
  
  In conversation about a year ago permalink
- DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 20:39:16 JST DozingCat :vivaldi_gray:
  in reply to
  - なかはらいちろう
  @lithium03 ここ１年以内とかそういうレベルの話なんですね。いつまでこれが続くんでしょうねぇ
  
  In conversation about a year ago permalink
- なかはらいちろう (lithium03@mastodon.lithium03.info)'s status on Saturday, 16-Sep-2023 20:44:57 JST なかはらいちろう
  in reply to
  
  @DozingCat H100が溢れてくれればw
  
  In conversation about a year ago permalink
- DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 20:44:57 JST DozingCat :vivaldi_gray:
  in reply to
  - なかはらいちろう
  @lithium03 実現可能性のほどはｗ
  
  In conversation about a year ago permalink
- no_name (sevenclans@mstdn.jp)'s status on Saturday, 16-Sep-2023 22:43:04 JST no_name
  in reply to
  
  @DozingCat
  私は必要な文献をすべて引っ張ってこれて、内容をデジタル検索できるようにして貰えたら御の字ですが、Alに聞けばそれで済むようにというのはなかなか難しいんじゃないですかね。
  機械はまだ言うほど崩し字読めてませんし、古典文法も分かってないと内容までは読めません。何より量も膨大な一方で、すべての文献が国会図書館に所蔵されている訳でもなく、多くは研究途上で、殆ど手つかずのものもまだまだあるんじゃないでしょうか。それをAlが答えてしまうとなると、内容がちょっと心配ですね。
  それでも模索していくべきだと思いますし、うまく活用できれば色々と捗るところも出てくるでしょうから楽しみではありますが。
  
  In conversation about a year ago permalink
- DozingCat :vivaldi_gray: (dozingcat@social.vivaldi.net)'s status on Saturday, 16-Sep-2023 22:43:04 JST DozingCat :vivaldi_gray:
  in reply to
  - no_name
  @sevenclans 確かに一連の作業を全てAIが代替するのは難しいというのは同意できます。
  崩し字に関しては機械学習を通じていずれは解読できるようになるでしょう。さし当たっては機械可読データに整形する必要があります。そのために現在国会図書館が取り組んでいるような人間の手による文献の電子化及び文字抽出を行うことが現実的でしょうか。文法に関しては、現在の我々の利用する言語でも不完全性が見え隠れしているのでその点の困難さはありますが、これもそう遠くないうちに解決できると考えます。
  しかし、文字が認識でき文法を解釈して読めたからと言って学問研究のレベルでそのまま出せるとは考えていません。得られた文献をどう調理するかが学問研究で問われていることですから、研究者独自の切り口を考慮すれば、そこをAIによって、ましてや他の人間が代替することも不可能でしょう。ただ、文献を収集する段階で必要な文献を過不足なく集めたりアタリを付けることに活用できると確信しています。
  
  In conversation about a year ago permalink

Public

Conversation

Notices

Feeds