やっぱりtoolで流し込まれる情報とLLM本体の情報との兼ね合いが難しいなあ。
Conversation
Notices
-
ぽな (C.Ponapalt) (ponapalt@ukadon.shillest.net)'s status on Wednesday, 11-Sep-2024 20:12:10 JST ぽな (C.Ponapalt) -
ぽな (C.Ponapalt) (ponapalt@ukadon.shillest.net)'s status on Wednesday, 11-Sep-2024 20:13:04 JST ぽな (C.Ponapalt) まあいいや、とりあえずしばらく放置なのだ。
-
ぽな (C.Ponapalt) (ponapalt@ukadon.shillest.net)'s status on Thursday, 12-Sep-2024 07:28:08 JST ぽな (C.Ponapalt) @yune_kotomi
自称LLMソムリエの雑評価- GPT-4o : 可もなく不可もなく安牌。とにかく安定している。余分なこと考えたくないならこれ一択。
- Claude 3.5 Sonnet : とても饒舌で人らしい。饒舌すぎてそれを抑え込むのがとてもたいへん。あと検閲がきびしい。
- Gemini 1.5 Pro : かなりのじゃじゃ馬。コントロールさえできれば強いかもしれない。なんかAPIが安定しない。
- Command R+ : 巷の評価には全部「パラ数の割には」という接頭辞がつく。オープンモデルの中では品質がとても良いと思う。…歯の間に何か挟まったような言い方をしている理由は察しろ。 -
殊海夕音 (yune_kotomi@tl1.yumenosora.net)'s status on Thursday, 12-Sep-2024 07:28:14 JST 殊海夕音 @ponapalt RAGとtoolに強いという謳い文句でロールプレイにも強いと噂のCommand R+にしてみるのはどうよ。 -
ぽな (C.Ponapalt) (ponapalt@ukadon.shillest.net)'s status on Thursday, 12-Sep-2024 09:36:30 JST ぽな (C.Ponapalt) @yune_kotomi むうむう。
-
殊海夕音 (yune_kotomi@tl1.yumenosora.net)'s status on Thursday, 12-Sep-2024 09:36:36 JST 殊海夕音 @ponapalt むぅ。
-