@article{oai:nagoya.repo.nii.ac.jp:00013306, author = {村田, 匡輝 and 大野, 誠寛 and 松原, 茂樹 and Murata, Masaki and Ohno, Tomohiro and Matsubara, Shigeki}, issue = {8}, journal = {情報処理学会研究報告 SLP, 音声言語情報処理}, month = {May}, note = {本論文では,日本語テキストにおける読点の自動挿入手法を提案する.読点は,文中の語や句などの構成要素を区切るために重要な役割を果たす.本手法は,音声認識や機械翻訳などの文生成モジュールや日本語の非母語話者のための文作成支援ツールの要素技術として利用できる.本研究では,読点の用法を分類し,用法ごとに読点の出現傾向を調査した.本手法では,形態素, 係り受け,節境界,読点間の距離などの情報を素性とする統計的手法によって読点の挿入位置を同定する.テキストコーパスを使用した実験によって本手法の有効性を確認した., This paper proposes a method of automatically inserting commas into Japanese texts. In Japanese, commas play important roles in explicitly separating constituents, such as word, phrase and clause, within a sentence. The method can be used as an elemental technology in natural language generation applications such as speech recognition and machine translation, or in writingsupport tools for nonnative speakers. We categorized the usages of commas and investigated the appearance tendency for each category. In this method, the points into which commas should be inserted are decided based on a machine learning approach. We conducted a comma insertion experiment using a text corpus and confirmed the effectiveness of our method., 『情報処理学会研究報告 自然言語処理研究会報告. v.2010-NL196, n.8, 2010, p.1-8』でもある}, pages = {1--8}, title = {読点の用法的分類に基づく自動読点挿入}, volume = {2010-SLP81}, year = {2010} }