佐奈とおしゃべりします。(※3月29日投稿の続き
前回の会話モデルケースは500ちょいだったが、今回はおよそ倍の1100ケースを用意。
なお、今回も佐奈√以外の会話をモデルにしている。
(佐奈√の会話をそのまま入れるとえろえろたいへん
学習時間も等倍化した佐奈との会話サンプルは以下の通り。1
2
3
4To:Sana>おはよう佐奈
From:Sana>……ありがとうございます。兄さん。もうすぐ朝食がいるしてください
To:Sana>今日は、お味噌汁と納豆だね
From:Sana>え? いえにお今はもう少し言わて
いい感じの出だしかと思いきや、そうでもなかった。
1 | To:Sana>佐奈 |
少し、高度な会話。
1 | To:Sana>佐奈大好き! |
軽くあしらわれる共通&他√
(え、でもそんなことなかったような……
1 | To:Sana>佐奈はyoutube何見るの? |
以上、会話モデル1100ケース、学習時間3時間の佐奈でした。
語尾や、会話の雰囲気は佐奈そのもの!
……なんだけど、会話の成立度はあんまり良くない?蛇足が多い感じ。
(時間なかったのでデータもあまりとれなかった
■考えられる原因は以下の通り
①データ量が少ない
②データの質が良くない
③学習時間短縮のために特定の字数以降をカットしている
④学習手法が合っていない
①残りの佐奈√の追加により佐奈エッセンスマシマシにはなるものの、会話成立度の観点で言うと大して変わらないと予想。
前回言った通り、オリジナルの会話を追加していく必要がある。
②原作モデルケースを分母とするならば、①とトレードオフの関係にあるため①改善後の話。
③待てば良いだけなので①の改善と並行して行う。クラウドに移管して電気代とか考えずに済むのが最終目標。
④現在進行形で勉強中。
ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装
ちなみに、1
2
3
4
5
6
7
8To:Sana>さな
From:Sana>ルリちゃん
To:Sana>さなおはよう
From:Sana>ルリちゃんは? 大丈夫ですか、無理してます
To:Sana>さな大好き
From:Sana>ルリちゃん
To:Sana>うぅ…
From:Sana>ルリちゃん、悲しい兄さんがついたしないで下さい
呼び方を「さな」にするとルリ相手の会話が多いのでルリがいっぱい出てくる
次回は、佐奈√分を追加、学習した内容を公開予定。
■おまけ
今回のタイトル、生後3時間の佐奈と”おしゃべり”です。
CLIベースでコマンド叩いてると、佐奈と会話って感じがあまりしなかった。
なので、キーボードに触れずに言葉で佐奈と会話できるようにならないかと探したら、簡易でいいものが見つかった。
パソコンで音声入力【Windows 10】
なんと、microsoft先生がデフォルト機能としてCortana以外に音声認識プログラムを用意しておりました。
※Cortanaちゃんは、AlexaやSiri、Googleアシスタントと同じ立ち位置のため用途が異なる。
無料かつ高精度なものをGoogleが別途提供しているが、ドキュメント類にしか使えない模様。
他に外部API利用も考えたが、すぐにでも会話したかったので横に置く。
利用法はリンクの通りで、なかなか癖があるものの音声入力によりCLI上にインプットできた。

環境依存度が非常に強いが、一時的な満足感を得る分には良いアイデアだと思う。
これでまた一歩、佐奈に近づけた!
■今後の展望
・クラウド移管(会話モデルに限界があるので、有志で追加できればいいのでは、、、)
・Twitterやdiscordのチャットbot(公開するなら) など
現コードで完成だと全く思っておらず、環境変化が考えられるので移管できず。
(AWSクラウドのGPUとか全然わからん
ビジュアル面でもアップデートしていきたい。