言語商会
Search
Edit
検索
ページ用ツール
ソースの表示
以前のリビジョン
バックリンク
ページの名称変更
サイト用ツール
最近の変更
メディアマネージャー
サイトマップ
ユーザ用ツール
管理
ログイン
文書の先頭へ
言語商会
>
旧研究室
>
SNOW
SNOW T10: KFTT日本語表記統制テキスト
Name in English
SNOW T10: normalized Japanese text of The Kyoto Free Translation Task
内容
Graham NEUBIG氏
が公開している
京都フリー翻訳タスク(KFTT)
の日本語テキスト部分を表記統制(表記ゆれ解消)したテキストです。
具体的には、
http://www.phontron.com/kftt/index-ja.html
で公開されている
Kyoto Free Translation Task (Data Only v. 1.0)
にある
data/orig/kyoto-dev.js
data/orig/kyoto-test.ja
data/orig/kyoto-train.ja
data/orig/kyoto-tune.ja
以上の4ファイルに対して表記統制を行ったものです。上記4ファイル(表記統制され単語分割されていない日本語テキスト)のみ加工して公開していますので、対訳英文や単語分割結果など、その他のファイルについては
京都フリー翻訳タスク(KFTT)
を参照してください。
表記統制は本研究室が作成している日本語解析システム「雪だるま」(2016年8月10日現在)を用いて行いました。
表記統制について、詳しくはこのページをご参照ください。
ダウンロード
圧縮ファイル(.tar.bz2)
(2016年8月10日公開)
利用制限・免責事項
このデータは
Creative Commons Attribution-Share-Alike License 3.0
に基づいて再配布可能です。
関連URL
京都フリー翻訳タスク(KFTT)
/
Graham NEUBIG(奈良先端大)
Wikipedia日英京都関連文書対訳コーパス
/ 情報通信研究機構(NICT)
フィードバック
本公開に対する責任はすべて山本にあります。
本公開に関するあらゆるご意見・苦情・ご感想は山本にお送りください。
(感想・要望・情報提供)