人形の目にカメラって例がないのかな、と思って検索すると、盗撮目的のやつがヒットする。
そりゃそうか……
機械生命体みたいな意識で捉える僕の方が偏屈なんだよな……
人形の目にカメラって例がないのかな、と思って検索すると、盗撮目的のやつがヒットする。
そりゃそうか……
機械生命体みたいな意識で捉える僕の方が偏屈なんだよな……
@TravelerJoe 目にカメラ、手足にサーボモーター群一式、耳にマイク、口にスピーカー
@ponapalt サーボはともかく、それ以外はラズパイと周辺パーツで何とかなりそう感あるよね?
ドール用内臓式コアユニット
@TravelerJoe 仕込むだけならね!
正しく聞いた・見たものを認識して、ちゃんと発話するとなるとエグいけどな!
@ponapalt
音声認識システム、映像認識システム、人声合成システム!
自作するのは無理だろうけど、
いずれも進化目まぐるしいから、もうじき個人ユースで使える時代が来ると思っているわ
@TravelerJoe それぞれ、音声や映像を文字にして、いろいろ頑張ってLLMに送り込み、回答を音声合成システムに放り込むまでなら、個人のお財布で頑張ればどうにかできちゃうのよね…
まあ個人の財布といっても、全システム束ねたら、へたこいたら車が買えるレベル(主にN社のGPUがたくさん要るせい)になるけども。
@ponapalt
よしLLMの代わりにSHIORIを使おう
:blobunyu: <人の気配がするときにランダムトークするだけかい
@TravelerJoe …もうスマートスピーカーでええわ :harisen:
@ponapalt たぶん系としては、スマートスピーカーのマイクとスピーカーを外だしするのが一番手軽っつーか、でもそれだとコストが高い(得られる自己満足度が低い)というか。
@yune_kotomi @ponapalt
1~2万でこういうの揃っちゃうんだねぇ。
ガワのほうはこれで良いような気がしてきた
@TravelerJoe @yune_kotomi
1.Voice Kitの中はラズパイだから、画面接続してそれっぽいの映せばよかろう説
2.そもそもこれで何も作らなくて全部揃う説 https://twitter.com/uezochan/status/1698168705262469144
@TravelerJoe @yune_kotomi でも、GPT-4に課金しても、ちゃんと記憶システム実装しても、人格的なものを感じるのはだいぶ先だなあという根本的なやつが…(まだいうか)
@ponapalt @yune_kotomi
ドールをインターフェースにする話で「画面に映せばよかろう」はお題がバックドロップしとるんよ
@ponapalt @yune_kotomi
それこそ進化を待たねばならんですねぇ。
076萌SNS is a social network, courtesy of 076. It runs on GNU social, version 2.0.2-beta0, available under the GNU Affero General Public License.
All 076萌SNS content and data are available under the Creative Commons Attribution 3.0 license.