ラズベリーパイを使ってみる – awkでテキストファイルをJSONに変換してみる –

変換元のテキスト

テキストファイル、カンマ区切りcsv。data.csvという名前で保存

20130207,06,12,ほげほげー1
20130207,09,13.25,ほげほげー2
20130207,12,15,ほげほげー3

変換先のテキスト

JSON、こんな感じで出てほしい

実行

awk -f hogehoge.awk data.csv

こんな感じのソースになった

hogehoge.awk

#!/usr/bin/awk

BEGIN	{
## Init
A1=&amp;quot;date&amp;quot;;A2=&amp;quot;temp&amp;quot;;A3=&amp;quot;message&amp;quot;;

## get line number
	cmd = &amp;quot;cat indata.csv |wc -l&amp;quot;
	cmd | getline t
	close(cmd)

FS=&amp;quot;,&amp;quot;;
printf(&amp;quot;[&amp;quot;);
}

{ # START MAIN loop
if(NR == t) { # データ終了行.カンマを付けない
	printf(&amp;quot;{&amp;quot;)
	printf(&amp;quot;&amp;quot;%s&amp;quot;: %s,&amp;quot;%s&amp;quot;: %s,&amp;quot;%s&amp;quot;: &amp;quot;%s&amp;quot;&amp;quot;,A1,$1,A2,$2,A3,$3);
	printf(&amp;quot;}&amp;quot;)
}
else{ # 1こめ〜データ終了の1個前まで.カンマをつける
	printf(&amp;quot;{&amp;quot;)
	printf(&amp;quot;&amp;quot;%s&amp;quot;: %s,&amp;quot;%s&amp;quot;: %s,&amp;quot;%s&amp;quot;: &amp;quot;%s&amp;quot;&amp;quot;,A1,$1,A2,$2,A3,$3);
	printf(&amp;quot;},&amp;quot;)
}

} # END MAIN loop

END {
printf(&amp;quot;]};n&amp;quot;);
}

が…

フィールド数3つと思ってたら4つだった／(^o^)＼

ここらへん

printf(&amp;quot;&amp;quot;%s&amp;quot;: %s,&amp;quot;%s&amp;quot;: %s,&amp;quot;%s&amp;quot;: &amp;quot;%s&amp;quot;&amp;quot;,A1,$1,A2,$2,A3,$3);

変えれば出来るんですが、どうもawkさんはprintfの中を'(シングルクオート)でかこむとエラー出すのでダブルクオート出すときはエスケープして出すしかないっぽいです(´・ω・｀) エスケープが多いのは打ちにくいし見づらいので苦手、sedもこれが嫌だったりする。
sedの場合はデリミタを%などに変更可能なのでいいですが、awkはそういう言語では無いので変更できないみたい。

まあ元々

awkはテキスト→json変換用言語でも無いので^^; どちらかというとsedの領域な気がするけど、awkにBEGIN,ENDがあるから以外とjson変換もこなすawk。けっこう器用なawkさんであった。おわり。

2013年3月
月	火	水	木	金	土	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31