@article{oai:nagoya.repo.nii.ac.jp:00009014, author = {杉木, 健二 and 松原, 茂樹 and 吉川, 正俊 and SUGIKI, KENJI and MATSUBARA, SHIGEKI and YOSHIKAWA, MASATOSHI}, journal = {情報処理学会研究報告}, month = {Mar}, note = {学術情報の電子化が進み、WWW上の学術情報リソースの高い流通性が求められており、これらのリソースに対する索引や目録としてメタデータを付与することが重要な課題となる。本論文では、WWW上の学術情報文書からメタデータを生成する方法について述べる。本研究では、NII限定子を用いてDublin Core Metadata Element Setを拡張したメタデータセットを用いた。まず固有名詞情報やリンク元のアンカーテキストを手がかりに、大学内のWebページをタイプ判定し、タイプ別にヒューリスティックルールを用いてメタデータの生成する。名古屋大学Webサイト資源に対してメタデータ生成実験を行った結果、本手法の実現可能性を確認した。, By electoronization of scientific information, the distributivity of the scholarly information resource on WWW is strongly required. It is becoming an important subject to give the metadata such as indexes and tables to these resources. This paper describes a method of generating the metadata from the scholarly document on WWW. This metadata is based on the metadata sets to which Dublin Core Metadata Element Set is extended by the schema of NII. First, by using information about the name entity and anchor texts of linked documents, the types of web pages are identified. Then, the metadata is generated using heuristic rules with each type. An experiment on metadata generation using Nagoya University Websites resources has shown the feasibility of our method.}, pages = {63--68}, title = {WWW上の学術情報文書からのメタデータ抽出}, volume = {DD-054}, year = {2006} }