アイソモカ

isomocha: 知の遊牧民の開発記録

2021-01-01から1年間の記事一覧

なんで怒ってるか分かる?

他者の心を推論する話で思い出した、ぼくが小学校3年か4年生くらいの頃、音楽の先生が怒ったときの話。 音楽の授業で音楽室に移動して、授業の始まりのチャイムが鳴ってもみんなわちゃわちゃしてた。そうしたら音楽の先生が怒り出して、 「今日は授業はもう…

Wild mushrooms ひとり反省会

あらBさんのポッドキャストに出演させていただきました。 Ep. 43 Piijey loves themself の続きです。 Ep. 45 Wild mushroomsピージェイさん @xiPJ とクリエイティブなことがやれないときの気持ちのエネルギー不足、自転車装備、2021年の新語・しょうもない…

Does Piijey love themself!?

あらBさんのポッドキャストに出演させていただきました。話したいトピックが多くて、 AirPods Pro 充電タイムを2回取らなきゃいけないくらいの長丁場になってしまったけど、楽しかったです。申し訳なさ&感謝が過ぎる。 今日公開されたのは前編です。 Ep. 43…

論文50本読む!じゆうちょう Advent Calendar 2021

じゆうちょう Advent Calendar 2021 - Adventarのための投稿です。「2021年にやってみた新しいこと」というお題で、研究を始めるときにやった「論文50本読む!」を紹介します。 背景 4月から情報科学博士課程の学生(D1)になりました。自然言語処理が専門です…

重箱隅突きぃ

ええかっこしぃ(ええ格好したがりな人)、緊張しい(緊張しがちな人)みたいに、重箱隅突きぃ(重箱の隅を突きがち)なピジェです。 もし自分が求めるほどのタスク処理能力が自分にないなら、人生をやるためにはあらゆるものを諦めるしかないのか? ぼくの…

新しいことに飛びつく自分と、日常をやりたい自分のケンカ

じぶんのなかの、面白そうな/新しいことにどんどん飛びついて取り入れてスケジュールをミチミチにしてしまう部分と、日常をやりながら物事にじっくり取り組みキッチリやりたい部分が、激しくケンカしてる。(さっき、後者が負けた音がした) どうやら、どっ…

開発記録 210917 Fri BertJapaneseTokenizer でトークン化(気になったこと)

『Pytorch自然言語処理プログラミング』の5章を引き続きやっていきます。 isomocha.hatenablog.com 気になったこと。 BertJapaneseTokenizer.encode() に『分かち書きした形態素リスト』を入力すると、どうやら WordPiece によるサブワード分割が働かないっ…

BERT は毎朝味噌汁を作るか 【BertForMaskedLM】

BertMaskedLMで遊んでいて「毎朝あなたのために[MASK]を作ります。」で[MASK]部分に入る語を予測したら 1位が「詩」(確率0.078)、2位が「番組」(確率0.077) …ってなってて、えーそうなん???となった。Wikipediaで学習したBERTは味噌汁作れへんねや。https…

開発記録 210916 BertJapaneseTokenizer をさわってみる

『Pytorch自然言語処理プログラミング』の1章が終わって、間を飛ばして5章をやってます。 book.impress.co.jp 東北大BERT cl-tohoku/bert-base-japanese · Hugging Face と BertJapaneseTokenizer を使って文を単語列に分割していきましょう。 ... ModuleNot…