アイソモカ

isomocha: 知の遊牧民の開発記録

ことば

立入禁止看板の禁止する人される人 #言語学な人々

言語学な人々Advent Calendar 2025 の参加記事です。言語学なみなさん、こんにちは! 言語と看板が好きなピジェです。 昨年2月には、#みんなの母語デー 企画で あちこちでみた多言語看板・貼紙たち という記事を書きました。 今回も、ことばであふれかえった…

ながらスマホ、ながら歩き、歩きスマホ

そういえば「ながらスマホ」と「ながら歩き」が(だいたい)同じことを指してるっぽいのが面白いと思った。 ながらスマホ STP!ながらスマホ 2023年7月 箕面公園 ながらスマホ危険 2018年10月 大阪地下鉄 動物園前駅 ちなみによく見ると "While smartpone dan…

鼻を鳴らす ≠ sound noses

花粉症で鼻の調子が悪く、たまに息を吸うとき鼻の奥が「フゴッ」って鳴る。ブタみたいだ。 どうしてブタは鼻を鳴らすのだろうか? 匂いを嗅ぐときに勢いよく息を吸うと音が出るかもしれないが、それだけではなく、鼻から強く空気を出すことで(トリュフを掘…

あちこちでみた多言語看板・貼紙たち

日常や旅先で、ことばを見かけたら観察せずにはいられない! そんな言語への興味から、いつのまにか自然言語処理プログラマになっていたピージェイです。みなさんこんにちは! 今日2月21日は国際母語デー (International Mother Language Day) ということで…

Building an interpreter in my mind

Reading "Eloquent JavaScript" Chapter 5, many things popped into my mind. Many of them are related to why I started this book: I want to be a "true" programmer, but what does that mean? The first thing I noticed is that readers of programs…

なろうレバ 第1話

「『ば』という接続詞は、一度だけ起きた出来事について述べるときに使うことはあまりないですよ〜」というのが、教科書的な説明だ。 たとえば、「ば」を使うのが不自然になる例として、次のようなものがある。 * 昨日、台所で変な音がするので泥棒かと思っ…

Does the 6-month-old Japanese eat rice with chopsticks?

下書きだけ書いていて公開するのを忘れていました。何度かゲスト出演させてもらってるあらBさんのポッドキャストあらB.fmで、「Twitterのスペースで公開収録するのはどう!?」というアイデアが出たので、やってみました。 初の試みでしたが、あらBさんが雑…

Twitter @xiPJ モーメント一覧

作ったモーメントがPCの自分のアカウントからしか見えなさそうなので、一覧を作っておきます。 twitter.com twitter.com twitter.com twitter.com twitter.com Pythonでつくる対話システム作者:竜一郎, 東中,通将, 稲葉,雅博, 水上オーム社Amazon Echo Dot (…

Eating persimmons 「ば」 rings the bell 補足&ひとり反省会

あらBさんのポッドキャストにモラズさんとレギュラーメンバー出演しました。ひとり反省会と補足記事です。 Ep. 56-1 Eating persimmons rings the bell ピージェイさん@xiPJ 、モラズさん@morazumorazu と福岡方言「あってる」、言語学フェス2022、なろうレ…

お母さん、彼女と食事に行くよ

日本語教育、第二言語としての日本語の補助教材でこの課を勉強しようとして、あーヤベッってなった話。 このブログの読者は日本語ネイティヴかネイティヴ並みに日本語を読めるひとたちだと思うので、この問題は簡単に解けるだろう。じゃあ、どうやって解くん…

はじめての語用論 第1章〜第3章

文脈や場面なしにことばを理解することはできないのではないかと思い、語用論に興味を持ち、教科書を読んでいます。端的にいうと空気が読めたい。 『はじめての語用論 基礎から応用まで』加藤重広・澤田淳 編(研究社) はじめての語用論: 基礎から応用まで…

開発記録 200113 Mon (Stemming, 100本ノック #052)

前回 #051 は空白を単語の区切りとみなしていたが、hand-written rules などの - でつながった単語がある場合、-も単語の区切りを表しているよな? と今回解きながら思った。 あと、( ) , . " などの記号も単語に含めるべきではないのではないだろうか。 し…

開発記録 191213 Fri (マスターテクストアプローチ、Pandas と Matplotlib)

なぜ物理を勉強し、今は言語とデータ分析を学ぼうとしているのかという問いには、日常のいろいろな現象を理解したいという共通の動機があると思う。 研究と人生 マスターテクストアプローチ 気になることば 「語り」「自分語り」 勉強会の宿題② dat ファイル…

開発記録 191108 Fri(かなり昔の事件です)

うーん、CaboCha ってどういうしくみで動いてんねやろなあ。 これ、副詞「かなり」の係り先を調べよう思て、解析してみてん。 # ipadic $cabocha それはかなり昔の話です。 それは-----D かなり-D | 昔の-D 話です。 EOS それはかなり昔の案件です。 それは-…

開発記録 191105 Tue(BCCWJと副詞)

いきなり寒くなったせいか、先週ちょっと仕事が忙しかったせいか、なんか体調がいまいち。はっきりとした症状はないが、だるすぎて午前休を取ってしまった。 今日やったこと 今日やったこと 副詞についてちょっと調べたメモ BCCWJで副詞を探す コアデータ ダ…

開発記録 191104 Mon(副詞の『の』度をはかる)

昨年書いた記事をQiitaから移植し、読み返しながら、続きをやろうと思った。 isomocha.hatenablog.com やったこと やったこと 副詞分析の準備 matplotlib 分析ファイルの場所 何をするかというと 『の』度のヒストグラム 『の』度 ヒストグラム 例 上位と下…

「はじめての言語ゲーム」、DIY: モニタ台作成

3連休にやったこと 3連休にやったこと 「はじめての言語ゲーム」を読んだ 感想 モニタ台材料の塗装

「肉のアスパラ巻き」は逆なのか?

「アスパラの肉巻き」と「肉のアスパラ巻き」はどちらが多いのか、BCCWJで調べてみました。

見せたいところと見せたくないところ、ことば。

自分のなかに、見せたいところと、見せたくないところがある。 隠しているわけじゃないけど、わざわざ見せないところもある。 考えていることは、たくさんあるはずなんだけど、 ことばで表現しようとすると、手が動かなくなる。 孤独の中で、書物から安らぎ…

名詞を「の」で修飾する副詞を探す (BCCWJ と 中納言 と Python)- 前半

Qiita からの移植記事です。移植に伴い、少々加筆修正しました(2019.11.4)。 前半の後の話 isomocha.hatenablog.com 元記事 qiita.com 計量国語学屋さんが使うという『現代日本語書き言葉均衡コーパス』(BCCWJ)を、言語学初心者のぼくも使ってみようと思っ…

MeCab のユーザー辞書を作る(UniDic)

MeCabのユーザー辞書を作って解析に使えるようにします。

『NHK 日本語発音アクセント辞典 新版』を買ったよ

『NHK 日本語発音アクセント辞典 新版』を買った。 この黄緑の『日本語発音アクセント辞典 新版』は1つ前のバージョンで、最新の『日本語発音アクセント新辞典』は一昨年(2016年に)発行されている。欲しいなーと思いつつも、5,400円もするので、なかなか買…

御堂筋線は metro か subway か?

この春から大阪市営地下鉄が Osaka Metro になったから、地下鉄の subway 表記が一新されてすべて metro になるのかと楽しみにしていたんだけど、どうやらそうでもないっぽい。相変わらず駅のサインは subway だし、公式サイトの英語のページにも subway と…

「在」と「有」

中国語を勉強し始めてしばらく悩んだのが、「在」と「有」だった。 どちらも日本語の「います」「あります」なんだけど、主語と目的語が反対のものをとるので、どうやって使い分ければいいのかよく分からなかった。なんとなく慣れてきたんだけど、日本語の勉…

同じじゃないもの、正しくないもの

このまえ、多文化共生の話を聞いていた時に、「違い」を漢字で書くと正しくないという意味に見えるからひらがなで「ちがい」と書きますと言っている人がいて、「違い」は「間違い」や「誤り」とは違うよ!!と思った。