基本情報

写真a

浅原 正幸

ASAHARA Masayuki


職名

准教授

研究分野・キーワード

自然言語処理

職務経歴(内部) 【 表示 / 非表示

  • 人間文化研究機構 国立国語研究所,准教授,2016年04月 ~ 継続中

略歴(外部) 【 表示 / 非表示

  • 日本学術振興会 特別研究員,2001年04月 ~ 2003年12月

  • 奈良先端科学技術大学院大学 情報科学研究科,助手→助教,2004年01月 ~ 2011年12月

  • 国立国会図書館 電子図書館課,非常勤調査員,2007年07月 ~ 2011年11月

  • 国立国語研究所 コーパス開発センター,特任准教授,2012年01月 ~ 2014年09月

  • 国立国語研究所 言語資源研究系,准教授,2014年10月 ~ 2016年03月

全件表示 >>

所属学会・委員会 【 表示 / 非表示

  • 言語処理学会

  • 情報処理学会

  • 日本語学会

  • 日本言語学会

専門分野(科研費分類) 【 表示 / 非表示

  • 図書館情報学・人文社会情報学

  • 認知科学

  • 言語学

  • 日本語学

  • 知能情報学

 

研究経歴 【 表示 / 非表示

  • 近代語コーパスに対する統語情報アノテーションの基準策定,2015年 ~ 2016年

    未設定,その他の研究制度

  • 言語コーパスに対する読文時間付与とその利用,2013年 ~ 2016年

    未設定,その他の研究制度

  • 大域情報を利用した同時処理による自然言語解析手法の研究,2011年 ~ 2013年

    未設定,その他の研究制度

  • コメディカル実践用語辞書データベースの作成,2009年 ~ 2011年

    未設定,その他の研究制度

  • 書き言葉コーパスの自動アノテーションの研究,2006年 ~ 2010年

    未設定,その他の研究制度

全件表示 >>

分担執筆 【 表示 / 非表示

  • Takuya Miyauchi, Masayuki Asahara, Natsuko Nakagawa, Sachi Kato,Annotation of Information Structure on "The Balanced Corpus of Contemporary Written Japanese",Koichi Hashida, Win Pa Pa,Computational Linguistics, 15th International Conference of the Pacific Association for Computational Linguistics, PACLING 2017

    Springer Nature Singapore,2018年03月,単行本(学術書)

  • 浅原正幸,第3章 形態素解析・品詞タグ付与・固有表現解析,松本裕治・奥村学,コーパスと自然言語処理

    朝倉書店,2017年12月,単行本(学術書)

  • ASAHARA Masayuki, DEN Yasuharu, MATSUMOTO Yuji,"The Handbook of East Asian Psycholinguistics, Vol. 2 Handbook of Japanese Psycholinguistics, M. Nakayama, R. Mazuka, Y. Shirai, Eds.,Computational Linguistics

    Cambridge: Cambridge University Press,2006年,その他

  • 松本 裕治,浅原 正幸,米田 隆一,松田 寛、坪井 祐太、高岡 一馬,「中日対訳語料庫的研制与応用研究論文集」徐一平, 曹大峰(編), 北京,統計的中日形態素解析のための品詞タグつきコーパス管理システム

    外語教学与研究出版社,,2002年,その他

論文 【 表示 / 非表示

  • Matsumoto Satomi, Masayuki Asahara, Setsuko Arita,Japanese clause classification annotation on the`Balanced Corpus of Contemporary Written Japanese',Proceedings of Asian Language Resources 13,2018年05月

    論文(国際会議録),共著

  • Masayuki Asahara, Hiroshi Kanayama, Takaaki Tanaka, Yusuke Miyao, Sumire Uematsu, Shinsuke Mori, Yuji Matsumoto, Mai Omura, Yugo Murawaki,Universal Dependencies Version 2 for Japanese,Proceedings of the 11th edition of the Language Resources and Evaluation Conference (LREC-2018),2018年05月

    論文(国際会議録),共著

  • Rui Suzuki, Kanako Komiya, Masayuki Asahara, Minoru Sasaki, Hiroyuki Shinnou,All-words Word Sense Disambiguation Using Concept Embeddings,Proceedings of the 11th edition of the Language Resources and Evaluation Conference (LREC-2018),2018年05月

    論文(国際会議録),共著

  • 浅原正幸,『国語研日本語ウェブコーパス』とその検索系『梵天』,JSL漢字学習研究会誌,10巻 ,2018年03月

    論文(学術雑誌),単著

  • 浅原正幸,河原一哉,大場寧子,前川喜久雄,『国語研日本語ウェブコーパス』とその検索系『梵天』,情報処理学会論文誌,59巻 2号 (頁 299 ~ 305) ,2018年02月

    論文(学術雑誌),共著

全件表示 >>

MISC 【 表示 / 非表示

  • ASAHARA Masayuki, Yuji Matsumoto,BCCWJ-DepPara: A Syntactic Annotation Treebank on the `Balanced Corpus of Contemporary Written Japanese',The 12th Workshop on Asian Language Resources (頁 49 ~ 58) ,2016年12月

    その他記事,共著

  • Takaaki Tanaka, Yusuke Miyao, Masayuki ASAHARA, Sumire Uematsu, Hiroshi Kanayama, Shinsuke Mori, Yuji Matsumoto,Universal Dependencies for Japanese,Proceedings of LREC 2016,2016年05月

    その他記事,共著

  • 浅原正幸, 森田敏生,コーパスコンコーダンサ『ChaKi.NET』のラベリング機能,言語処理学会第22回年次大会発表論文集,2016年03月

    研究発表要旨,共著

  • 浅原正幸, 河原一哉, 武井裕也, 舛岡英人, 大場寧子, 鳥井雪, 森井亨, 前川喜久雄, 加藤祥, 小西光,『国語研日本語ウェブコーパス』の検索系,言語処理学会第22回年次大会発表論文集,2016年03月

    研究発表要旨,共著

  • 田中弥生, 浅原正幸,Yahoo!知恵袋における修辞ユニット分析の中核要素認定に関する諸問題,言語処理学会第22回年次大会発表論文集,2016年03月

    研究発表要旨,共著

全件表示 >>

口頭発表 【 表示 / 非表示

  • 浅原正幸,梵天講習会,梵天講習会,ジャストシステム本社,2018年03月,国内会議,公開講演,セミナー,チュートリアル,講習,講義等

  • 浅原正幸,近藤明日子,加藤祥,国語研で開発している 語義タグ付きデータと辞書,「all-words WSD システムの構築及び分類語彙表と岩波国語辞典の対応表作成への利用」研究発表会,国立国語研究所,2018年03月,国内会議,口頭(一般)

  • 浅原正幸,梵天講習会・ChaKi.NET講習会,梵天講習会・ChaKi.NET講習会,国立国語研究所,2018年03月,国内会議,公開講演,セミナー,チュートリアル,講習,講義等

  • 菊地礼,加藤祥,浅原正幸, 「感じる」を指標とするメタファー用例の収集とその分析,日本語用論学会 メタファー研究会 2018年3月18・19日 2-Day シンポジウム「身体性」,関西大学千里山キャンパス,2018年03月,国内会議,口頭(一般)

  • 田中弥生,浅原正幸,児童による作文の修辞ユニット分析における中核要素認定,言語処理学会第24回年次大会,岡山コンベンションセンター(ママカリフォーラム),2018年03月,国内会議,ポスター(デモ発表含む)

全件表示 >>

学術関係受賞 【 表示 / 非表示

  • 吉川 克正、浅原 正幸、松本 裕治,言語処理学会優秀論文賞 2013年,2014年03月,その他の賞,言語処理学会

  • Yanyan Luo, Masayuki Asahara, Yuji Matsumoto,Best paper award of the 7th International Conference on Natural Language Processing and Knowledge Engineering,2011年11月,その他の賞,7th International Conference on Natural Language Processing and Knowledge Engineering (NLPKE)

  • Katsumasa Yoshikawa, Tsutomu Hirao, Sebastian Riedel, Masayuki Asahara and Yuji Matsumoto,the Best Paper Award of the SMBM2010 (the Fourth International Symposium on Semantic Mining in Biomedicine),2010年10月,その他の賞,the Fourth International Symposium on Semantic Mining in Biomedicine

  • 岩立 将和, 浅原 正幸, 松本 裕治,第14回年次大会優秀発表賞,2008年03月,その他の賞,言語処理学会

  • 浅原 正幸,山下記念研究賞,2003年10月,その他の賞,情報処理学会

その他競争的資金獲得実績 【 表示 / 非表示

  • 科学研究費補助金(挑戦的萌芽研究),2015年 ~ 2016年,近代語コーパスに対する統語情報アノテーションの基準策定

    文部科学省

  • 科学研究費補助金(基盤研究(B)),2013年 ~ 2016年,言語コーパスに対する読文時間付与とその利用

    平成25年度は、まず実験環境の構築を行った。対象とするテキストコーパスとして「現代日本語書き言葉均衡コーパス」のコアデータ中の書籍サンプルと新聞サンプルを対象とし、自己ペース読文法の実験環境と、視線走査法の実験環境を構築した。20人規模で自己ペース読文法の被験者実験を、8人規模で視線走査法の被験者実験を行い、実験を大規模に行う際に起きる問題点を検証した。結果、視線走査法において、画面遷移時の注視点の制御について問題があることがわかった。また、被験者の募集が低調であったために、効率的に被験者を募集する手法についても検討を行った。小規模ではあるがデータを収集し、データの構造化を進めた。文字列の線形順序と視線遷移順序の両方を読み時間情報とともに帳票形式で保存する方法を検討した。検索環境構築においては、予算の制約により、予定していた2つのソフトウェアのうちChaKi.NETに対してのみ読文時間対応を行うこととした。平成25年度は現行の ChaKi.NETの機能により、どのレベルの問い合わせと可視化が可能かについての検証を行った。検証においては、分担者との議論だけでなく、第5回コーパス日本語学ワークショップにおけるポスター発表により広く意見を募った。結果、書記言語における文字列の線形順序と人間の読文過程における単語認識順序が、自己ペース読文法においては一致するが、視線走査法においては読み戻しや読み飛ばしが発生し、2つの順序間の対照比較の類型化が必要なことがわかった。

    文部科学省

  • 科学研究費補助金(基盤研究(A)),2011年 ~ 2013年,大域情報を利用した同時処理による自然言語解析手法の研究

    自然言語処理の基本的な解析法である単語分かち書き、品詞解析、統語解析、述語項構造解析に対して、広い情報および複数の解析の同時処理に関する研究を行った。英語に関して、品詞解析と統語解析をつなぐ情報として機能として複単語表現の収集とそれを用いた品詞解析および統語解析の性能向上を実現した。統語解析について、トップダウンとボトムアップの情報の同時利用が可能な解析手法や複数の解候補の大域的な違いを同時に考慮するため統語森から最適解を選択する手法を提案した。述語項構造解析について、様々な素性とそれらを同時利用する方法の提案、および、Markov Logic Networksを利用する手法を提案した。

    文部科学省

  • 科学研究費補助金(基盤研究(B)),2009年 ~ 2011年,コメディカル実践用語辞書データベースの作成

    本年度は,研究分担者と研究協力者の所属する2病院より,倫理審査申請などの諸手続きを行い,個人が特定できないよう処置を施したテキスト形式の医療情報を提供して頂き,これらとWeb上で公開されている鹿児島大学付属病院で開発された看護度分類および患者状態項目を基に,1.臨床看護の経験者3名と共に実践用語の抽出と選定(7,450語)を行い,2.ComeJisyoV3(登録語数41,592語)を作成・公開し,3.機械学習用コーパス(約30万行)を作成した.なお,病院で蓄積される医療情報には半角文字と全角文字が混在しているため,昨年度公開のComeJisyoV2では,全角文字への変換は行わず,公開したが,半角文字を分かち書きする際に文字化けが起きる.そこで今回公開のComeJisyoV3では,臨床看護の経験者によりComeJisyoV2(登録語彙数34,142語)の用語,品詞,読みの見直しを行い,収集した医療情報の文字コードを調べたところ,シフトJISコード特有領域の文字が含まれていたため,辞書の作成過程において,他の文字コードへの変換は行わず,シフトJISコードで一貫し,システム辞書とは別に運用するユーザ辞書として公開した.汎用性のある辞書を作成する上で,異なる病院および診療科別での語種構成や品詞構成に相違があるか否かを知ることは重要である.そこで4.2病院の医療情報について計量的な用語...

    文部科学省

  • 科学研究費補助金(特定領域研究),2006年 ~ 2010年,書き言葉コーパスの自動アノテーションの研究

    日本語コーパスに対する様々な言語情報のアノテーションを自動的に行う言語解析ツールの開発,および,アノテーションの誤り修正やアノテーションを施されたコーパスの柔軟な利用や管理を行うためのコーパスツールの開発を行った.具体的には,形態素解析,係り受け解析,並列構造解析,固有表現認識,述語項構造解析,照応・共参照解析,事象間時間関係解析などの自動解析,および,これらのアノテーションを施したコーパスを構築した.

    文部科学省

全件表示 >>