話し言葉の構造

この日は朝から東京で打ち合わせがあり、出張する。打ち合わせ前に打ち合わせメンバーであったid:mamoruk先生とハンバーガーを食べる。前にも一度来たことがあるのだが、おいしかった。

チェルシー マーケット (CHELSEA MARKET) - 秋葉原/ダイニングバー [食べログ]


ミーティングで、日本語話し言葉の構造解析について話題になる。対話システムをやっているともちろん話し言葉の解析はひとつの問題になるわけだけど、個人的に話し言葉の解析の難しさは、それが表出する際に書き言葉のような内省、推敲が十分に行われていないことにあると思う。従って省略、換言、倒置等が頻繁に起こるわけだが、話し言葉で何を省略しても良いのか、何が省略されないかについてはもはや言語情報のみを追って推定することは不可能ではないかと思う(逆に十分に推敲された文章に関しては、このあたりは厳密に曖昧性が少なくなるよう考慮されていると思う)。つまり異なるモーダルを利用して対話中にどのように話者同士の了解事項が形成されていくかを、今一度真面目に観察しないといけない。対話時の発話の生成モデルってどうなっているんだろうなぁ。

研究の話をする流れで自分の研究に関する話もするが、やっぱり問題が山積し過ぎていて、ある問題に片っ端から手を付けてるみたいな感じになってない?という感想を頂いた。うーん…

あと、雑談の定義とか目的ってなんだろうね、そもそも目的ない場面で会話なんか起こるの?やっぱり目的がないと対話のモデルを作るの無理じゃない?みたいな話をした。

帰りの新幹線前まで飲んで、新幹線の終電で帰宅。飲み会で項構造解析について、飯田先生とボトムアップがいいのかトップダウンがいいのかみたいな話をする。現状MSTみたいなトップダウンで項構造解析をしようとすると、使うべき素性が多すぎるのと、結局それをやると事例ベースになってしまうというような話をした。うーん、難しい。