基本情報

写真a

小木曽 智信

OGISO Toshinobu


職名

教授

研究分野・キーワード

日本語学 , コーパス , 形態素解析 , 日本語史 , 語彙 , 文法 , 表記 , 構造化テキスト , 電子化辞書 , 近代語 , 言文一致 , 辞書データベース , 記述研究 , 書き言葉コーパス , 国語学 , 言語学 , XML , 可能表現

出身大学 【 表示 / 非表示

  • 東京大学  文学部  日本語日本文学(国語学)専修課程

    大学,1995年03月,卒業

出身大学院 【 表示 / 非表示

  • 東京大学大学院  人文社会系研究科  日本文化研究専攻 日本語日本文学専門分野 修士課程

    1997年03月

  • 東京大学大学院  人文社会系研究科  日本文化研究専攻 日本語日本文学専門分野 博士課程

    2001年06月

  • 奈良先端科学技術大学院大学  情報科学研究科  情報処理学専攻(自然言語処理学) 博士課程

    2014年03月

職務経歴(内部) 【 表示 / 非表示

  • 人間文化研究機構 国立国語研究所,准教授,2009年10月 ~ 2017年03月

  • 人間文化研究機構 国立国語研究所,教授,2017年04月 ~ 継続中

略歴(外部) 【 表示 / 非表示

  • 明海大学 外国語学部,専任講師,2002年07月 ~ 2005年03月

  • 成蹊大学文学部,非常勤講師,2005年04月 ~ 継続中

  • 独立行政法人 国立国語研究所,研究員,2006年04月 ~ 2009年09月

  • 人間文化研究機構 国立国語研究所,准教授,2009年10月 ~ 2017年03月

  • 上智大学文学部,非常勤講師,2014年04月 ~ 継続中

全件表示 >>

所属学会・委員会 【 表示 / 非表示

  • 近代語学会

  • 情報処理学会

  • 言語処理学会

  • 日本語学会

  • 東京大学国語国文学会

全件表示 >>

専門分野(科研費分類) 【 表示 / 非表示

  • 日本語学

  • 知能情報学

  • 日本語学

  • 知能情報学

 

研究経歴 【 表示 / 非表示

  • 日本語歴史コーパスの多層的拡張による精密化とその活用,2015年 ~ 2018年

    未設定,その他の研究制度

  • 近世口語文を対象とした形態素解析辞書の開発,2012年 ~ 2014年

    未設定,その他の研究制度

  • コメディカル実践用語辞書データベースの作成,2009年 ~ 2011年

    未設定,その他の研究制度

  • 「単語情報付きコーパス」を用いた近現代の語彙・語法史の研究,2009年 ~ 2011年

    未設定,その他の研究制度

  • 書き言葉コーパスに基づくテキスト分類尺度の探索的研究,2009年 ~ 2011年

    未設定,その他の研究制度

全件表示 >>

単著 【 表示 / 非表示

  • 前川 喜久雄, 辻井 潤一, 投野 由紀夫, 徳永 健伸, 丸山 岳彦, 山崎 誠, 小木曽 智信, 中村 壮範, 山口 昌也,コーパス入門 (講座 日本語コーパス),朝倉書店,2013年07月

    その他

  • 田中 牧郎, 岡島 昭浩, 小木曽 智信, 小野 正弘, 小島 聰子, 島田 泰子, 朱 京偉, 高田 智和, 張 元哉, 陳 力衛, 近藤 明日子, 須永 哲矢,近代語コーパス設計のための文献言語研究成果報告書,国立国語研究所,2012年

    その他

  • 斎藤 達哉, 豊島 秀範, 伊藤 鉄也, 小木曽 智信, 高田 智和,米国議会図書館蔵『源氏物語』翻字本文 :人間文化研究連携共同推進事業「海外に移出した仮名写本の緊急調査」報告書 若菜上〜幻,人間文化研究機構国立国語研究所,2012年

    その他

  • 小木曽智信, 中村壮範,『現代日本語書き言葉均衡コーパス』形態論情報データベースの設計と実装,国立国語研究所,2011年

    その他

  • 荻野綱男, 田野村忠温, 小野正弘, 岡島昭浩, 服部匡, 小木曽智信, 前田広幸,コーパスとしてのウェブ,明治書院,2011年

    その他,pp.137-183

全件表示 >>

分担執筆 【 表示 / 非表示

  • 小木曽智信,通時コーパスに見るモダリティ形式の変遷,データに基づく日本語のモダリティ研究

    63--82,くろしお出版,2020年03月,単行本(学術書)

  • OGISO, Toshinobu,Stylistic differences across time and register in Japanese texts: a quantitative analysis based on the NINJAL corpora ,The Japanese Language from an Empirical Perspective: Corpus-based studies and studies on discourse

    197--218,Ljubljana University Press, Faculty of Arts,2020年01月,単行本(学術書)

  • 小木曽智信,A2-1 言語,文化情報学事典

    96--101,勉誠出版,2019年12月,事典・辞書

  • 小木曽智信,「通時コーパス」とその利用法,新しい古典・言語文化の授業 コーパスを活用した実践と研究

    18--31,朝倉書店,2019年01月,単行本(学術書)

  • 小木曽智信,検索,日本語学大辞典

    東京堂出版,2018年10月,事典・辞書

全件表示 >>

共著・編著 【 表示 / 非表示

  • 村上征勝,金明哲,小木曽智信,中園聡,矢野桂司,赤間亮,阪田真己子,宝珍輝尚,芳沢光雄,渡辺美智子,足立浩平,文化情報学事典,勉誠出版,2019年12月

    事典・辞書,共編・共著(共編著)

  • 河内昭浩、池上尚、小木曽智信、小林正行、杉山俊一郎、鈴木泰、須永哲矢、服部紀子、宮城信、渡辺由貴甲斐伊織、下田俊彦,新しい古典・言語文化の授業 コーパスを活用した実践と研究,朝倉書店,2019年01月

    単行本(学術書),共著

  • 近藤泰弘・田中牧郎・小木曽智信 編,コーパスと日本語史研究 (ひつじ研究叢書(言語編) 第127巻),ひつじ書房,2015年10月

    その他,共編

論文 【 表示 / 非表示

  • 白井良介,松村雪桜,小木曽智信,小町守,近代の歴史的資料を対象とした機械学習による文境界推定,情報処理学会論文誌,61巻 2号 (頁 152 ~ 161) ,2020年02月

    論文(学術雑誌),共著

  • 村山実和子,小木曽智信,中村壮範,形態論情報の多重化による洒落本コーパスの質的拡張,情報処理学会研究報告,2017‐CH‐114巻 8号 (頁 1 ~ 8) ,2017年05月

    論文(その他学術刊行物等),共著

  • 藤本 灯,北﨑 勇帆,市村 太郎,岡部 嘉幸,小木曽 智信,高田 智和,「「人情本コーパス」の設計と構築」,国立国語研究所論集,12巻 (頁 1 ~ 12) ,2017年01月

    論文(大学,研究機関紀要),共著

  • 藤本 灯,北﨑 勇帆,市村 太郎,岡部 嘉幸,小木曽 智信,高田 智和,「人情本コーパス」の設計と構築,国立国語研究所論集12号 (頁 1 ~ 12) ,2017年01月

    DOI:info:doi/10.15084/00000850,論文(大学,研究機関紀要),単著

  • 小木曽智信,自然言語処理から照射した現代日本語文法―統計的機械学習と「文法」―,日本語文法,16巻 2号 (頁 20 ~ 31) ,2016年09月

    論文(学術雑誌),単著

全件表示 >>

MISC 【 表示 / 非表示

  • 小木曽智信,NINJAL-Oxford「通時コーパス」国際シンポジウム―ここまでできた!『日本語歴史コーパスとその活用』,ことばの波止場,5巻 (頁 8) ,2019年03月

    総説・解説,単著

  • 小木曽智信,日本語歴史コーパスの構築―ここまでできた!『日本語歴史コーパスとその活用』,ことばの波止場,5巻 (頁 6 ~ 7) ,2019年03月

    総説・解説,単著

  • 小木曽 智信,電子機器の利用による表記・字体の変化 : 書き言葉コーパスから,日本語学,36巻 10号 (頁 2 ~ 12) ,2017年09月

    総説・解説,単著

  • 小木曽智信,ネットワークにつなぐこと,東京大学国語国文学会会報54号 (頁 1) ,2016年03月

    その他記事,単著

  • 小木曽 智信,コーパス活用の勘所(第17回)【日本語史】中古語の文法(2)係り結びと連体形終止,明治書院,日本語学,34巻 10号 (頁 68 ~ 73) ,2015年08月

    その他記事,単著

全件表示 >>

口頭発表 【 表示 / 非表示

  • 相田太一,小町守,小木曽智信,高村大也,坂田綾香, 小山慎介,持橋大地,単語分散表現の結合学習による単語の意味の通時的変化の分析,言語処理学会第26回年次大会 (NLP2020),オンライン開催,2020年03月,国内会議,口頭(一般)

  • 小木曽智信,服部紀子,髙橋雄太,『日本語歴史コーパス』CHJ講習会,『日本語歴史コーパス』CHJ講習会,名古屋大学,2020年02月,国内会議,公開講演,セミナー,チュートリアル,講習,講義等

  • 小木曽智信,オープンサイエンスとしてのコーパス日本語学の可能性,名古屋大学大学院人文学研究科日本語学分野公開講演会,名古屋大学,2020年02月,国内会議,口頭(招待・特別)

  • 小木曽智信,『日本語学大辞典』とコーパス・言語処理 ,『 日本語学大辞典 』 刊行1周年記念公開講演会ミニシンポジウム『日本語学大辞典』が拓く世界,東京大学本郷キャンパス,2019年11月,国内会議,口頭(招待・特別)

  • 小木曽智信,日本語歴史コーパス (CHJ),NINJALセミナー「日本語研究の基盤としての言語資源」,上海外国語大学松江キャンパス,2019年11月,国際会議,公開講演,セミナー,チュートリアル,講習,講義等

全件表示 >>

学術関係受賞 【 表示 / 非表示

  • 河瀬彰宏,市村太郎,小木曽智信,最優秀ポスター賞(金賞),2013年12月,その他の賞,PNC/じんもんこん合同カンファレンス

  • 小木曽智信,山下記念研究賞,2011年03月,その他の賞,情報処理学会

その他競争的資金獲得実績 【 表示 / 非表示

  • 科学研究費補助金(基盤研究(A)),2015年 ~ 2018年,日本語歴史コーパスの多層的拡張による精密化とその活用

    文部科学省

  • 科学研究費補助金(基盤研究(C)),2012年 ~ 2014年,近世口語文を対象とした形態素解析辞書の開発

    文部科学省

  • 科学研究費補助金(基盤研究(C)),2009年 ~ 2011年,和文系資料を対象とした形態素解析辞書の開発

    初年度である21年度は、まず中古仮名文学作品を対象とした形態素解析辞書を作成するために、主要な中古仮名文学作品を学習用コーパスとして整備するとともに、辞書データベースに未登録語を追加する作業を行った。具体的には『伊勢物語』『大和物語』『土佐日記』『更級日記』『紫式部日記』と『源氏物語』の一部のテキスト、計約11万語分を学習用コーパスとして整備し、ここに現れた未登録語を辞書データベースに登録、これらのデータを用いて形態素解析器MeCab用の辞書を作成した。最新版の解析辞書(中古和文UniDic ver.0.4)の精度は、語彙素認定のレベル(単語の境界認定,品詞認定,辞書の見出し認定のすべてが正解)で約95.5%となった。当初、漢字仮名交じりに校訂済みの中古仮名文学作品(物語・日記文学等)について精度95%以上で解析することを目標としていたが、(未知語を含まない環境下ながら)すでにこれを達成することができた。今後、さらに精度を向上させ、解析できるテキストの範囲を拡大するため、解析辞書の整備を続ける予定である。日本の古典文学のテキストを、研究に利用可能な、実用的な精度で自動解析できる形態素解析辞書の開発・公開は初めてのことであり、今後、この解析辞書を応用した古典研究の進展が期待される。特にコーパス言語学の手法を用いた語彙・文法分野での応用が期待されるが、この点については次年度以降、...

    文部科学省

  • 科学研究費補助金(基盤研究(B)),2009年 ~ 2011年,コメディカル実践用語辞書データベースの作成

    標準化された用語がないまま、電子カルテシステムは普及し、電子医療記録文書が蓄積される中、我々は医療記録文書で使われる用語77, 775語を収録した辞書ComeJisyoを作成・公開し、また、語種と字種の分布を明らかにした。ComeJisyoは、電子医療記録文の単語分割の解析精度を90%以上に向上させ、複数の解析結果の比較(メタ分析)を可能とする。また、ComeJisyoに付加されるヨミガナは、音声への変換や仮名漢字変換等に活用できる

    文部科学省

  • 科学研究費補助金(基盤研究(C)),2009年 ~ 2011年,「単語情報付きコーパス」を用いた近現代の語彙・語法史の研究

    コーパス言語学の方法を近代語から現代語への史的研究に本格に導入することを目指し、近現代の「単語情報付きコーパス」を用いた語彙・語法史研究に着手した。平成21年度は、次の三つのことを実践した。(1)解析辞書「UniDic」の拡張これまでに開発を進めてきた近代文語を対象とした形態素解析辞書「近代文語UniDic」に、語彙を増補した。(2)近代雑誌の形態素解析と語彙頻度表作成これまでに作成を進めてきた雑誌『明六雑誌』(1874年、1875年)『国民之友』(1887年、1888年)、『太陽』(1895年、1901年、1909年、1917年、1925年)、『中央公論』(1933年、1941年、1949年)等のコーパスについて、近代文語UniDicを用いて形態素解析を実施し、語彙頻度表を作成した(3)近代の語彙・語法史の探索的研究上記の雑誌のコーパスと語彙頻度表を用いて、語彙史と語法史の探索的研究に着手し、次の三つのテーマで研究を進めた。・近代雑誌における漢語の性格付け『明六雑誌』の漢語について、『日本国語大辞典』(第2版)の記載情報と対照し、近代になって登場する新しい漢語の性格を考察した。・形容動詞連体形の推移「優秀なる」「優秀な」「優秀の」のように、形態が三種類にゆれる形容動詞連体形について、近代から現代に至る推移を考察した。・定着する漢語と衰退する漢語語彙頻度に基づく三つの統計指標...

    文部科学省

全件表示 >>

 
 
 

学会・委員会等活動 【 表示 / 非表示

  • 国語学会(日本語学会),情報電子化委員・庶務委員

  • 日本語学会,情報電子化委員長

  • 言語処理学会,編集委員

  • 日本語学会,編集委員