WEKO3
アイテム
学術論文におけるURLを用いた引用を対象とした要否判定用データセット
http://hdl.handle.net/2237/0002012356
http://hdl.handle.net/2237/00020123560f5b04a4-9811-4ca1-9766-995907260313
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
|
| アイテムタイプ | itemtype_data_ver1(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2025-04-09 | |||||||||
| タイトル | ||||||||||
| タイトル | 学術論文におけるURLを用いた引用を対象とした要否判定用データセット | |||||||||
| 言語 | ja | |||||||||
| タイトル | ||||||||||
| タイトル | The dataset for citation-worthy detection of URL citations in scholarly papers | |||||||||
| 言語 | en | |||||||||
| 作成者 |
和田, 和浩
× 和田, 和浩
|
|||||||||
| 寄与者 | ||||||||||
| 寄与者タイプ | ContactPerson | |||||||||
| 姓名 | Matsubara Laboratory Department of Intelligent Systems Graduate School of Informatics Nagoya University Matsubara Laboratory Department of Intelligent Systems Graduate School of Informatics Nagoya University Furo-cho Chikusa-ku Nagoya 464-8601 Japan | |||||||||
| 言語 | en | |||||||||
| 姓名 | 名古屋大学大学院 情報学研究科 知能システム学専攻 松原研究室 〒464-8601 名古屋市千種区不老町名古屋大学大学院情報学研究科知能システム学専攻松原研究室 | |||||||||
| 言語 | ja | |||||||||
| 寄与者 | ||||||||||
| 寄与者タイプ | DataManager | |||||||||
| 姓名 | 和田, 和浩 | |||||||||
| 言語 | ja | |||||||||
| 姓名 | Wada, Kazuhiro | |||||||||
| 言語 | en | |||||||||
| 寄与者 | ||||||||||
| 寄与者タイプ | HostingInstitution | |||||||||
| 姓名 | Nagoya University | |||||||||
| 言語 | en | |||||||||
| 姓名 | 名古屋大学 | |||||||||
| 言語 | ja | |||||||||
| アクセス権 | ||||||||||
| アクセス権 | open access | |||||||||
| アクセス権URI | http://purl.org/coar/access_right/c_abf2 | |||||||||
| キーワード | ||||||||||
| 言語 | en | |||||||||
| 主題Scheme | Other | |||||||||
| 主題 | Informatics | |||||||||
| キーワード | ||||||||||
| 言語 | ja | |||||||||
| 主題Scheme | Other | |||||||||
| 主題 | 情報通信 | |||||||||
| 内容記述 | ||||||||||
| 内容記述タイプ | Abstract | |||||||||
| 内容記述 | Dataset for citation-worthy detection for citations using URLs from three fields: Natural Language Processing, Astrophysics, and Electrical Engineering and Systems Science. For the natural language processing field, conference papers from ACL, NAACL and EMNLP from the ACL Anthology were used, and for the astrophysics and electrical engineering and systems science fields, papers from the arXiv were used. Nougat OCR was used to convert the PDFs of the papers to text. Each file was separated by year of publication (natural language processing) or month of publication (astrophysics, electrical engineering and systems science) of the paper. Each line in the file represents a sentence, and a sentence containing ``[URL_CITE]‘’ indicates that a citation with a URL is required. | |||||||||
| 言語 | en | |||||||||
| 内容記述 | ||||||||||
| 内容記述タイプ | Abstract | |||||||||
| 内容記述 | 自然言語処理,天体物理学,電気工学・システム科学の3分野からなるURLを用いた引用を対象とした要否判定用データセット.自然言語処理分野はACL AnthologyからACL, NAACL, EMNLPの本会議論文を,天体物理学,電気工学・システム科学分野はarXivの論文を使用した.論文PDFのテキスト化にはNougat OCRを使用した.各ファイルは論文の出版年(自然言語処理)または出版月(天体物理学,電気工学・システム科学)ごとに分けられている.ファイル内の各行が要否判定の対象の文を表し,``[URL_CITE]''が含まれる文はURLを用いた引用が必要であることを表す. | |||||||||
| 言語 | ja | |||||||||
| 公開者 | ||||||||||
| 公開者 | 名古屋大学 | |||||||||
| 言語 | ja | |||||||||
| 言語 | ||||||||||
| 言語 | eng | |||||||||
| 資源タイプ | ||||||||||
| 資源タイプresource | http://purl.org/coar/resource_type/c_ddb1 | |||||||||
| 資源タイプ | dataset | |||||||||
| 関連情報 | ||||||||||
| 関連タイプ | isReferencedBy | |||||||||
| 言語 | ja | |||||||||
| 関連名称 | 和田和浩, 角掛正弥, 松原茂樹: URL 引用の要否判定において学習データの品質とドメインが与える影響の分析, 言語処理学会第31回年次大会論文集, pp. 2462-2466, Mar. (2025). | |||||||||
| 助成情報 | ||||||||||
| 識別子タイプ | Crossref Funder | |||||||||
| 助成機関識別子 | https://doi.org/10.13039/501100001691 | |||||||||
| 助成機関名 | 日本学術振興会 | |||||||||
| 言語 | ja | |||||||||
| 研究課題番号 | 23K18506 | |||||||||
| 研究課題番号URI | https://kaken.nii.ac.jp/ja/grant/KAKENHI-PROJECT-23K18506/ | |||||||||
| 研究課題名 | 学術論文における被引用文献の貢献度測定:文献の新たな評価法を目指して | |||||||||
| 言語 | ja | |||||||||
| 書誌情報 |
発行日 2025-03-13 |
|||||||||