NL研の発表 - あしたからがんばる ―椀屋本舗

今週頭にあったNL研の発表をチェックする。５月のNL & SLPは学生セッションと学生奨励賞があり、同年代で頑張っている人の発表が見れたりするので面白い。一番気になっていたのはこれ。

文脈情報と格構造の類似度を用いた日本語文間述語項構造解析
○林部祐太，小町守，松本裕治（奈良先端大）

今日は実家帰りだったので、帰りにひと通り読んでみた（実家に帰るときは片道１時間半くらい時間がある）。D1の人の発表でおそらく修論をまとめたものだと思うが、とても丁寧に書かれている。考察、やるべきこともしっかり順を追って埋められていて、これは学生奨励賞を取るよなあ、という感じ。自分の研究はとても散漫になりがちなので、見習いたい。

おおよそとしては述語項構造解析の大域的素性として格構造間の類似度を定義し、似た格構造の格要素としては同じものが埋まりやすいという主張をベースに進む。直感的にもそうだろうなと思うようなアイディア。格構造間の類似度の定義にはJSダイバージェンスを使い、項構造解析履歴において類似度がmaxとなる格構造を取って文間照応を行う。

個人的な疑問は２点あって、まずは格構造の類似度を取るときに述語語義が２つ以上ある場合はどうするのかということ。これは現場の質疑でもあったようで、NL201のログを参照すると

Q: エラーの例は類似度計算では捉えられないというより，対応付けの問題ではないか？格構造の類似度という考え方では扱えない例というのはなかったか？
A: 人手で判断しても揺れる事例が多く，根本的に難しい．語義曖昧性解消をしてから類似度を測るなどのやり方があるが，曖昧性解消をするためには項の情報が必要であり，にわとりと卵の関係にある．語義曖昧性解消と項の解消を同時にやる手法を考える必要がある．機能動詞結合に関するものも同様．

と書いてある。以前読んだ東北大のの渡邉陽太郎さんの論文

CiNii 論文 - 述語語義と意味役割の結合学習のための構造予測モデル

は参照しなくていいのかな、と思わなくはない。
あと、語義の曖昧性というのはトピックや分野によっても変わるだろうと思うので、全部の分布類似度で一気に扱うのは少し乱暴な気がした。

もう一点は履歴の中から項構造解析履歴から名詞句を選ぶときに、maxを取らずにこれを確率っぽく扱ったら精度は変わったりしないのかな、ということ。計算量増えるだろうし、ほんとに精度が上がるかわからんけど。

感想は大体そんな感じ。自分の研究にも活かしていけそうだし、同学年が頑張ってると僕も頑張ろうと思える。林部さん、おめでとうございます！

閑話休題、7月のSLPで発表することになりました。JKJには君も５月のNLで発表して学生奨励賞を狙いに行くべきと発破をかけられましたが、正直NLPで発表して５月のNL研でも発表するのは苦しいと思います…

最近買った、もらった、読んでいる本など