言語商会
Search
Edit
検索
ページ用ツール
ソースの表示
以前のリビジョン
バックリンク
ページの名称変更
サイト用ツール
最近の変更
メディアマネージャー
サイトマップ
ユーザ用ツール
管理
ログイン
文書の先頭へ
言語商会
>
旧研究室
>
SNOW
SNOW D16:やさしい日本語格フレーム
Name in English
SNOW D16: Case Frames of Simplified Japanese
内容
やさしい日本語2,000語に対して構築した格フレームです。
格フレームとは、名詞、格、動詞の3者の関係を表にしたものです。例えば「走る」のガ格には人や動物、乗り物が出現する、といったことが分かります。格フレームは係り受け解析や語義曖昧性解消など、自然言語処理の基本処理に利用されます。
この格フレームは、やさしい日本語2,000語に含まれる単語のみから構成されるもののみを構築しました。
ここで言う「やさしい日本語」とは、我々が独自に定義したUniDic単語体系の2,000語です。
詳しくはやさしい日本語の解説ページをご覧ください。
格フレームはすべて人手で構築しました。
構築のために単語n-gram統計を使うなど、コーパスを最大限活用すると共に、手作業によって追加・削除を行いました。
構築手法に関して、詳しくは下記の文献[1]をご覧ください。
格フレーム構築の際に必要となる、名詞のまとめ上げも手作業で行いました。
例えば「乗り物」カテゴリーは「タクシー , トラック , バイク , バス , パトカー , 列車 , 波 , 船 , 車 , 鉄道 , 電車」となります。
一見するとこれはただの意味分類ですが、格フレーム構築に必要な粒度で分類されているところが特徴です。例えば「ヒト」は「ヒト(役割)」「ヒト(数)」「ヒト(組織)」「ヒト(要素)」に分類されています。
閲覧・検索
デモページ
ダウンロード
XLSXファイル
(263KB)
利用制限・免責事項
利用制限は特にありません。
再配布は禁止します。
本研究室は、本言語資源の内容に関する完全性、正確性、適用性、有用性などいかなる保証も行いません。 また、本研究室は本言語資源の提供の遅延、もしくは中断、または本言語資源の利用、もしくは利用不能に起因して本人または他の第三者が被った損害に対して一切の責任を負いません。
研究利用の際は下記の関連文献[1]を引用いただけると助かります。
関連文献
[1] 角張 竜晴, 山本 和英. やさしい日本語格フレームの構築による係り受け解析. 言語処理学会第24回年次大会, pp.777-780 (2018.3)
フィードバック
本公開に対する責任はすべて山本にあります。
本公開に関するあらゆるご意見・苦情・ご感想は山本にお送りください。
格フレーム内容の改善にご協力いただける方を歓迎します。記述内容に追加や誤りなどがありましたらお送りいただければ改訂します。
(感想・要望・情報提供)