アイソモカ

isomocha: 知の遊牧民の開発記録

2019-01-01から1年間の記事一覧

開発記録 191219 Thu (Flaskで作った画像を表示)

前々回 191214 と 前回 191215 の続き。 Flask を使って、アップロードした dat ファイルのデータをグラフにして表示します。 UNIXコマンド:cpで上書きするか確認してくれ 勉強会の宿題③ ブラウザにグラフを表示 画像を埋め込む方法、 static/ python コー…

開発記録 191215 Sun (Pandas と Matplotlib)

昼は Python 勉強会お疲れさまでした。アドバイスを頂けてよかったです。 Flask は一旦置いておいて、ばじる氏にいただいたサンプルデータをプロット(グラフ描画)してみましょう。 勉強会の宿題② dat ファイルを解析してみようの続き タブ区切りファイルか…

開発記録 191214 Sat (pandas と Flask)

友人とのランチに向かう途中、キャンセルの連絡が朝来ていたことに気づいて、ちゃんと確認していなかった自分に呆れながらラーメン食べた。おいしかった。 勉強会の宿題② dat ファイルを解析してみようの続き Python コマンドライン引数 [まだ] X軸・Y軸両方…

開発記録 191213 Fri (マスターテクストアプローチ、Pandas と Matplotlib)

なぜ物理を勉強し、今は言語とデータ分析を学ぼうとしているのかという問いには、日常のいろいろな現象を理解したいという共通の動機があると思う。 研究と人生 マスターテクストアプローチ 気になることば 「語り」「自分語り」 勉強会の宿題② dat ファイル…

開発記録 191211 Wed (統計、Flask、データ処理)

ああっ、今日も帰りにコーヒー豆を買うのを忘れた。 やったこと やったこと 統計(ここまで座学) 勉強会の宿題① Flask を触ってみよう "Hello" を時間に応じて変える VS Code のエラー表示を解消 勉強会の宿題② dat ファイルを解析してみよう 気象データの…

開発記録 191210 Tue (統計)

統計学の教科書を入手しました。 表紙に書いてあるとおり、基礎から積んでいく感じです。 便利なツールの使い方よりも、何をどうやればいいのか理論を固めたほうがいいかなと思いまして。たぶんやりたいことが明確なら、ツールの使い方はググればわかるよね…

開発記録 191209 Mon (Flask と MySQL)

このまえの 第1回 Python 勉強会で、Flaskを触ってみよう〜ということになって、 とりあえずこの記事を見ながらなんかやってみることにした。 qiita.com が、「DB(MySQL)を利用する」の部分で怒られが発生している。 記事外でやったこと MySQL をインストー…

開発記録 191207 Sat (100本ノック #047)

みんなのよく言う「マイニング」って何なんやろ。文章を分析するのに、テキストマイニング以外の何かがあるのだろうか。 前回の続き。 isomocha.hatenablog.com やったこと やったこと 調べたことメモ len() で調べる要素数は1から始まる リストを後ろから取…

開発記録 191205 Thu (100本ノック #047)

滷味包でスペアリブを煮ている。昨日から煮始めて、だいぶいい感じになってきた。 47. 機能動詞構文のマイニング 動詞のヲ格にサ変接続名詞が入っている場合のみに着目したい.46のプログラムを以下の仕様を満たすように改変せよ. 「サ変接続名詞+を(助詞…

開発記録 191201 Sun (100本ノック #046)

最近のノリノリ開発 BGM はアヴィーチー。Amazon Music のプレイリストで聴いて気に入った。 46. 動詞の格フレーム情報の抽出 45のプログラムを改変し,述語と格パターンに続けて項(述語に係っている文節そのもの)をタブ区切り形式で出力せよ.45の仕様に…

開発記録 191201 Sun (100本ノック #045)

やったこと やったこと UNIX コマンド ファイルを探す: find ファイルを処理する: sort と uniq コマンドを組み合わせる: | コマンドを実行した結果をファイルに書き出す 指定した文字が含まれている行を抽出する: grep 100本ノック #045 (後半) 頻出…

開発記録 191130 Sat (UNIXコマンド、100本ノック #045)

むちゃむちゃ腹が痛え。ココアがうまい。 もう11月も終わりですよ。早くね? 45. 動詞の格パターンの抽出 今回用いている文章をコーパスと見なし,日本語の述語が取りうる格を調査したい. 動詞を述語,動詞に係っている文節の助詞を格と考え,述語と格をタ…

開発記録 191127 Wed (100本ノック #044, 頭が赤い魚を食べる猫)

与えられた文の係り受け木を有向グラフとして可視化する。 頭が赤い魚を食べる猫(リメイク) pic.twitter.com/VUrw0gOWMn— 中村明裕 (@nkmr_aki) 2018年8月18日 このお茶目でかわいい猫さん、大好きです。 頭が赤い魚を食べる猫 ↓ MeCab + IPA辞書 + CaboCh…

開発記録 191126 Tue (100本ノック #044、懐かしい音楽を聴く)

44. 係り受け木の可視化 与えられた文の係り受け木を有向グラフとして可視化せよ.可視化には,係り受け木をDOT言語に変換し,Graphvizを用いるとよい.また,Pythonから有向グラフを直接的に可視化するには,pydotを使うとよい. 係り受け木(画像検索する…

開発記録 191125 Mon (100本ノック#043)

一時期は本当に寒くて、真冬になったらどうなってしまうのかと震えていたが、ここ数日は比較的暖かい。 今日はこれをやりました。 43. 名詞を含む文節が動詞を含む文節に係るものを抽出 名詞を含む文節が,動詞を含む文節に係るとき,これらをタブ区切り形式…

開発記録 191124 Sun (100本ノック #042)

中文老師にいただいた台湾土産の乾麺「曽拌麵 香蔥椒麻」を食べた。油そば。ちょうどよい辛さとネギ油の香りがとてもよく、弾力がありピロピロした平めんも美味しかった。 100本ノック #042 42. 係り元と係り先の文節の表示 係り元の文節と係り先の文節のテ…

開発記録191124 Sun (100本ノック#041, UniDic)

自然言語処理100本ノック #041 を仕上げ、形態素解析辞書 UniDic を導入した。 やったこと やったこと 100本ノック #041 コードを整理した 完成 形態素解析用の辞書をIPA から UniDic に変更 UniDicの出力を編集 確認 MeCab のデフォルト辞書を設定 ユーザー…

開発記録 191108 Fri(かなり昔の事件です)

うーん、CaboCha ってどういうしくみで動いてんねやろなあ。 これ、副詞「かなり」の係り先を調べよう思て、解析してみてん。 # ipadic $cabocha それはかなり昔の話です。 それは-----D かなり-D | 昔の-D 話です。 EOS それはかなり昔の案件です。 それは-…

開発記録 191105 Tue(BCCWJと副詞)

いきなり寒くなったせいか、先週ちょっと仕事が忙しかったせいか、なんか体調がいまいち。はっきりとした症状はないが、だるすぎて午前休を取ってしまった。 今日やったこと 今日やったこと 副詞についてちょっと調べたメモ BCCWJで副詞を探す コアデータ ダ…

開発記録 191104 Mon(副詞の『の』度をはかる)

昨年書いた記事をQiitaから移植し、読み返しながら、続きをやろうと思った。 isomocha.hatenablog.com やったこと やったこと 副詞分析の準備 matplotlib 分析ファイルの場所 何をするかというと 『の』度のヒストグラム 『の』度 ヒストグラム 例 上位と下…

「はじめての言語ゲーム」、DIY: モニタ台作成

3連休にやったこと 3連休にやったこと 「はじめての言語ゲーム」を読んだ 感想 モニタ台材料の塗装

開発記録 191028 Mon (100本ノック#041)

文節を表すクラス Chunk の実装。 メンバ変数のうち、形態素(Morphオブジェクト)のリスト(morphs)と、係り先文節インデックス番号(dst)が入れられた。 係り元文節インデックス番号のリスト(srcs)は、まだ。

開発記録 191027 Sun (100本ノック#040 & パネル塗装)

自然言語処理100本ノックの続きと、 先日製作したデスクパネルの塗装。 昨日と今日やったこと 昨日と今日やったこと 実装の続き ちょっと気になるところ ひとまず完成 答え合わせ クラスの特殊メソッドを定義する def __str__(self): 各文をMorphオブジェク…

デスクパネル(机上の衝立)を自作しました

DIY

先日部屋の模様替えをして、机が壁向きだったのを、部屋向きにして壁に背を向けて座るようにしました。Skype のときに部屋のごちゃごちゃが映らなくなって快適です。 模様替え前 │(╹◡╹) │[ 机 ] └──壁──── 模様替え後 ────壁──┐ (╹◡╹) │ [ 机 ]│ な…

開発記録 191016 Wed (100本ノック#040)

引き続き自然言語処理100本ノックの#40を考えている。 クラスとオブジェクトの考え方が難しい。なんか本かレッスンで系統的に勉強したほうがいいのか?

開発記録 191014 Mon (100本ノック#040)

昨日はスーパーで刺身用ハマチがめっちゃ安くて喜んで買ってきて食べたけど、生臭くて微妙だった。残りは今日の昼は焼いてほぐし丼にした。 話題の映画 JOKER を観に行きたかったけど、一緒に行こうと言っていた配偶者と予定が合わず、次の週末に延期になっ…

開発記録 191013 Sun (CaboChaが文節を区切ってくれない件、一応解決)

昨日は CaboCha を Mac にインストールしたが、文節の切れ目がなんかおかしかった。いろいろトライした結果、Python3 と curl xz、crf++ 、MeCab、CaboCha を再インストールして解決した。結局どれが悪かったのかは分からず(再インストールしなくても済む方…

開発記録 191012 Sat (100本ノック #040, CaboCha入れたけどなんか変…じゃなかった)

台風が来て、Amazon Prime Music で「そこに鳴る」などを流しながら、洗濯や部屋の片付けをした。 久しぶりに python でなんか書いたり自然言語処理の勉強をしようと思って、PCの中を見てみたところ、どうやら自然言語処理100本ノックは(飛び飛びではあるが…

「肉のアスパラ巻き」は逆なのか?

「アスパラの肉巻き」と「肉のアスパラ巻き」はどちらが多いのか、BCCWJで調べてみました。

boat people や 新しい在留資格 などの話を聞いた

今日は、 boat people や 新しい在留資格 などの話を聞いた。