安住の地を求めて
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
スポンサー広告 | コメント(-)| トラックバック(-)|
または、ジョゼで遊ぼう、とかジョゼを弄ぼう、でも正解かな。

結構前から、いわゆるひとつの人工無能(人工知能じゃないよ)には興味があったのですが、ジョゼを見ていて無性に自分で無能を作って見たくなりました。
ジョゼはクリックされると寄って来て、何かしらコトバのキレハシを話します。
何かのハズミで長文を話すこともありますが、大抵の場合は単語を適当に連結しただけの無意味な文章です。
この時、文のフォーマットは5・7・5の俳句の形になるっぽいので、サーバー側で単語を切り出して文字数をカウント、ソレらしくなるように接続詞などを詰め込んで帳尻合わせをしていると考えられます。

単語に切り出す作業で、辞書を見ながら最短になるように切ってしまっているのが、どうにもペットが頭が悪く見えてしまう要因であるように思います。

例えば、「ブックマーク」を「ブック」と「マーク」に切り分けるのは強ち悪い方法では無いと言えなくもないですが、「ワタシ」を「ワタ」と「シ」に切り分けてしまうのは頂けません。
ジョゼが「ワター♪」とか言ってるんで何事かと思ったんですが「ワタ飴」とか、事前にサーバー側の辞書にワタが先行で載ってしまってて切り分けが妙なことになってしまっているのではないかと・・・。

ユーザーサイドで出来る事ではありませんが、文字種を見てカタカナ・ヒラガナ・漢字などの切り替わるタイミングで、あるいは””とか「」で区切られている区間とか、HTMLなどのタグで括られている区間(強調表示とか色を変更している箇所とか色々ね)を抜き出して辞書を参照するような改善がなされれば、もう少し長めの単語も覚えてくれて、クリックした人も幸せになれるんじゃないか?って気がしたりしなかったりです。

あとは完全に想像なんですが、明示的な改行とかあると切り出しの参考にしてたりしないでしょうか?

なので、適当な活用とかを一行に一つずつ並べて書いていくと、俳句を作る時に使ってくれたりするんじゃないかと・・・。(希望的すぎ?)

あと、ことわざなんかをガンガン突っ込んでやると七五調になってるものが多いと思われるので参考にしてくれるかも知れず。

あ、カルタとか百人一首なんかを書いておけば無問題?

相変わらずバカな事ばっかり考えているワタシなのでした。
スポンサーサイト
コメント

ウナギと無邪気しかいわんなぁ・・・・・

他のネタ求む!
2005/02/19(土) 11:10:15 | URL | おれさま #-[ 編集]
コメントする
URL:
Comment:
Pass:
秘密: 管理者にだけ表示を許可する
 
この記事のトラックバックURL
http://omae.blog5.fc2.com/tb.php/8-9c382034
トラックバック
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。