知の遊牧民

好奇心が羊です

「肉のアスパラ巻き」は逆なのか?

「肉のアスパラ巻き」に対し、え、それ逆だろ!という意見を耳にし、 同型の表現はどのくらいあるのかに興味を持ちました。

現代日本語書き言葉均衡コーパス(BCCWJ)で用例を調査した結果、 57件の用例のうち、「アスパラの肉巻き」型が 67 %、「肉のアスパラ巻き」型が 19 % という結果になりました。

魚と昆布の場合には、「鮭の昆布巻き」というような「アスパラの肉巻き」型が 100 % であったのに対し、 肉類と野菜の場合には表現がゆれることが分かりました。

今回使用したBCCWJ では「肉の野菜巻き」というような例はどちらの型か判別できなかったため、 このような型を調査するのが今後の課題です。

続きを読む

知の遊牧民

自己紹介

はてなブログのみなさん、はじめまして。ピージェイと申します。

ことばを観察するのが好きです。対象は特に慣れ親しんだ日本語で、計量的研究に興味があります。

これまでやってきたこと

  • 修士まで物理をやってきました。専門は実験原子核物理です。
  • 仕事では、設計や CAE をやってきました。
  • 日本語教育に関して独学し、日本語教育能力検定試験に合格しました。
  • 地域の日本語教室で、日本語学習支援をしています。
  • 中文を學習しています。
  • ロードバイクでゆっくり山を走るのが好きです。

リンク

普段は Twitter で地味に文章を書き散らしています。

twitter.com

Qiita にも少し文章を書いています。

qiita.com

開発記録はブログに。

isomocha.hatenablog.com

見れば分かると思いますが、熱しやすく冷めやすいタイプなのが情けないです。

温かく見守って、フォローやリプライいただけると幸いです。よろしくお願いします。

ブログ名の由来

渋谷で勧誘してきたワーホリ紹介の人としゃべったときに「やりたいことを追いかけて転々とする遊牧民みたいなタイプですよね」みたいなことを言われて、間違いねえと思ったからです。

今週のお題「わたしの自由研究」

人生は研究の連続だと思っています。

名詞を「の」で修飾する副詞を探す (BCCWJ と 中納言 と Python)- 前半

Qiita からの移植記事です。移植に伴い、少々加筆修正しました(2019.11.4)。

前半の後の話

isomocha.hatenablog.com

元記事

qiita.com

計量国語学屋さんが使うという『現代日本語書き言葉均衡コーパス』(BCCWJ)を、言語学初心者のぼくも使ってみようと思ってやってみました。 書き言葉を集めたデータベースである BCCWJ を使って、副詞の使われかたを観察します。

前半の今回は、同期と目標、データの取得、解析(前半)について書いていきます。

目次

  • 目次
  • 動機 と 目標
  • 現代日本語書き言葉均衡コーパス』(BCCWJ)のデータを取得する
  • 準備
    • 表記ゆれの統一
    • UniDic での副詞の扱い
    • 順位と出現数
      • ① 〈副詞〉
      • ② 〈副詞〉 + 「の」 + 〈名詞〉
  • 解析
    • 相関プロット
    • プロット上での例 (いきなり・かなり・まさか・もっと)
    • 今後の解析
続きを読む

語種とモーラの種類の関係を調べたい(UniDic)(前半)

Qiita からの移植記事です。

qiita.com

*このプロジェクトは取り組み中です。

計量言語学を勉強し始めて、「データで学ぶ日本語入門」(計量国語学会編、朝倉書店)を読んでいる。 先日、計量国語学会の特別講義で第1章から第5章までの解説を聞くことができた。 第1章の音声・音韻−現代の日本語には何種類の音があるの? どの音がよく使用されているの?』の部分で、「和語」「漢語」「外来語」の3つの語種では、使用されるモーラの種類が違うかもしれない。この本で勉強する初学者は、手を動かして比較してみたらいいかも〜と聞いた。やってみよう。

続きを読む

MeCab のユーザー辞書を作る(UniDic)

Qiita からの移植記事です。

qiita.com

自分用メモ。

環境

  1. MeCab 0.996 と UniDic(ver. 2.1.2) をインストールした。
  2. MeCabの設定ファイルを編集して、UniDicを使えるようにした。 参考 👉 MeCabとUNIDICをUbuntu 14.04にインストール - Yura YuLife
  3. MeCabの設定ファイルを編集して、語種を表示できるようにした。参考 👉 MeCab + Unidic を使って単語の語種(和語、漢語)を表示する - Qiita

ゴール

ユーザー辞書を作って解析に使えるようにする。

続きを読む