甘辛LOVER

旧:where there is no haiku

はてなハイクのデータをはてなブログに移行する手順【後編】

ハイクのデータをはてなブログにインポートした手順の続きです。
前回作ったデータをさらに加工していきます。
ここではとりあえず、↓な感じで。
・ハイクの本文をブログの本文にする
・ハイクの投稿日時をブログの投稿日時にする
・ハイクのキーワードをブログの記事タイトルとカテゴリにする

他に入れたい要素入れたくない要素があれば、同じ要領で書いてみてください。

 

*3/15 実況をまとめる手順を追記しました。


■Bパート

(1)データの形を確認します。ExcelでもLibreOfficeでも同じ。左から[created_on][URL][author][target_name][body_text][時間がかかれた列]になっているということで進めます。JSONからの方は以下のように読み替えたうえで、別シートのこうなるようにコピーするとかしてください。

created_on → created_at(repliesじゃないほう)
URL → link
author → userのid
target_name → keyword
body_text→ haiku_text
時間がかかれた列 → たぶんC列

 

(2)各セルに以下のように入力して、一番下までオートフィルします。
Excelの場合はハイフンの連続を入れるときに警告が出ると思います。[はい]か何かそのまま修正に同意するほうを選んでください。

G2に「="TITLE: "&D2」
H2に「="DATE: "&TEXT(F2,"mm/dd/yyyy hh:mm:ss")」
I2に「="CATEGORY: "&D2」
J2に「-----」
K2に「BODY:」
L2に「=E2」
M2に「--------」

 

(3)G2からM列の一番下の行まで範囲選択し、右クリックしてコピーします。

 

(4)秀丸エディタを新規で立ち上げ、今コピーした内容を貼り付けます。

 

(5) [正規表現]にチェックを入れて以下の置換を行います。

検索→置換
「\t」→「\n」

 

(6)名前を付けて保存]から、エンコードの種類を[UTF-8]にして、テキストファイル(*.txt)として保存します。BOMはつけなくていいです。ファイル名もなんでもいいです。

 

(7) (6)で作成したテキストファイルをはてなブログでインポートします。ファイルサイズは文字だけなので大したことはないので、アップロードして実行したらそのまま気長に待ちましょう。私は1時間くらいでした。

以上でおわりです。

 


■Bパート 実況をまとめる場合

実況をまとめる手順です。サンプルはこちら
日毎にまとめる体なので、元の時間だけつけるようにしてみました。

 

(1)データの形を確認します。ExcelでもLibreOfficeでも同じ。左から[created_on][URL][author][target_name][body_text][時間がかかれた列]になっているということで進めます。JSONからの方は以下のように読み替えたうえで、別シートのこうなるようにコピーするとかしてください。

created_on → created_at(repliesじゃないほう)
URL → link
author → userのid
target_name → keyword
body_text→ haiku_text
時間がかかれた列 → たぶんC列

 

(2)まとめたい投稿だけ別のシートに移動またはコピーします。

 

(3)A列をキーに昇順で並べ替えます。A列の左に列を挿入します。

 

(4)投稿の区切りになる行のA列(↑で挿入した新しい列です)に、「★」を入力します。区切りなるというのは、まとめた時に一番上に来る行です。サンプルで言うところの「ナイス眼鏡×2」の行。

 

(5)各セルに以下のように入力して、一番下までオートフィルします。

H2に「=IF(A2="★","--------","")」
I2に「=IF(A2="★","TITLE: "&E2,"")」
J2に「=IF(A2="★","DATE: "&TEXT(G2,"mm/dd/yyyy hh:mm:ss"),"")」
K2に「=IF(A2="★","CATEGORY: "&E2,"")」
L2に「=IF(A2="★","-----","")」
M2に「=IF(A2="★","BODY: ","")」
N2に「="<p>"&TEXT(G2,"hh:mm")&"<br />"&F2&"</p><br />"」

 

(3)H2からN列の一番下の行まで範囲選択し、右クリックしてコピーします。

 

(4)秀丸エディタを新規で立ち上げ、今コピーした内容を貼り付けます。

 

(5) [正規表現]にチェックを入れて以下の置換を行います。

検索→置換
「\t\t\t\t\t\t」→何も入力しない
「\t」→「\n」

 

(6)[名前を付けて保存]から、エンコードの種類を[UTF-8]にして、テキストファイル(*.txt)として保存します。BOMはつけなくていいです。ファイル名もなんでもいいです。


(7) インポートします。

 

以上でおわりです。


うまくいかなかったらコメント欄にどうぞ。