2022-03-01から1ヶ月間の記事一覧
前の記事はこちら。 midoliko-tsuki.hatenablog.com 結果フォルダを作成。フォルダ名は「ocr_作業した日時(yymmddhhmmss)」 PDFフォルダのファイル名リストを取得 ファイル名リストからPDFを選び出して変換対象リストを作る 変換対象リストから変換対象ファ…
前の記事はこちら。 midoliko-tsuki.hatenablog.com ブログを書きながら調べ物しながらプログラムを書くのは分かりやすくていいのですが、ノートパソコンの狭い画面ではだんだんしんどくなってきました。広いモニタがほしい。 それはさておき、実際にコード…
前の記事はこちら。 midoliko-tsuki.hatenablog.com テキストを新規作成して結果を書き込むのはできそうな気がする。でも、ディレクトリ内のPDF全部に同じ処理を繰り返している中で、結果のテキストファイルに元のPDFと同じ名前をつけるやり方が分からない。…
前の記事はこちら。 midoliko-tsuki.hatenablog.com 1 前回書いた基礎設計的なやつに沿って、必要なモジュールとかを調べていこう、の巻。【#02】のときに書いたプログラムが、書いたとはとても言えないくらい理解できてないので、ついでにちょっとでも不明…
Python日記ばっかり書いてたらなんか別人みたいな気になってきたので、バランスを取るために買い物の話をします。 母の日商戦、どんどん日程が早くなってるなあと思います。かつては4月の中旬に注文していて、それでもだいぶ早いほうだったのに、いまやこの…
前の記事はこちら。 midoliko-tsuki.hatenablog.com 1 やっぱり基礎が大事よね!と、買った本を読んでいたのですが、当面必要のなさそうな感じがすると、途端に集中力がなくなってしまいます。 これはよろしくないと思ったので、やりたいことについて考えな…
前の記事はこちら。 midoliko-tsuki.hatenablog.com 1 初めて書いたPythonのプログラムがどうにかこうにか動いたところで、このあたりのてんやわんやをブログに書いてみよう、と思ったわけですが、ブログを書くことには思わぬ効能がありました。 分かってな…
前の記事はこちら。 midoliko-tsuki.hatenablog.com 1 PDFをOCRで処理してテキストを抽出しよう、ということで、参考にしたのはこちら。 dev.classmethod.jp どうせこれでもできないんじゃないのー、とやさぐれながら真似してみたら「NO OCR tool dound」と…
前の話はこちら。 midoliko-tsuki.hatenablog.com 1 Pythonを勉強してみると決めて、まず本を買いました。独習Python作者:山田 祥寛翔泳社Amazon たぶんネット上の情報だけでも基本は勉強できるんだろうとは思ったのですが、流れるようにTwitterを開く様が想…
0 このところPythonというものを触ってみているのですが、Twitterでぴかーどさんに勧められたこともあり、せっかくなので経過をブログに書いてみることにしました。有益な内容はなくて、ただの日記です。途中で日記が更新されなくなったら(その可能性は大…