浅野直樹の学習日記

この画面は、簡易表示です

浅野直樹

Pythonで退屈な作業を自動化する「第22章 画像中の文字認識」の訳後感

訳文はPythonで退屈な作業を自動化するです。

この章は第3版で新設されました。

OCRは進歩の著しい領域であり、実務で必要になることも多いので、この内容が収録されたのは喜ばしいことです。

ただし、英語ではかなりの精度を誇っていても、日本語の精度は劣ります。本文中で示されている『フランケンシュタイン』の日本語訳の認識結果でも誤認識が目立っています。

本文で説明されているようにLLMを活用して修正する余地はあるかもしれません。また、最初からLLMに画像を読み込ませたり、Google Cloud Vision AIを使ったりすれば、日本語の認識精度が高くなるでしょう。

原著者も述べているように、Pythonを使うと高度な技術の詳細を意識せず簡単に利用できるのがいいですね。



令和7年度秋期情報処理安全確保支援士試験に合格しました

令和7年度秋期情報処理安全確保支援士試験に合格しました。

受ける直前までの記事は令和7年度秋期情報処理安全確保支援士試験を受けます、受けた直後の記事は令和7年度秋期情報処理安全確保支援士試験を受けましたです。

手応えと結果がおよそ一致しており、想定通りの形で受験を終えることができました。

 



Pythonで退屈な作業を自動化する「第21章 グラフ作成と画像処理」の訳後感

訳文はPythonで退屈な作業を自動化するです。

画像処理とグラフ作成は大きな分野であり、この章はボリュームが大きかったです。

色とRGBA値といったコンピュータ画像の基礎から説明されているのがうれしいです。

この章で扱われているPillowが使えれば画像関係のたいていの処理はできますし、もし画像認識等でOpenCVを使うことになったとしてもここで学んだ基礎が生きてきます。

原文には曖昧な部分があり、訳す際にサイズの単位であるポイントとピクセルの違いに悩みました。

フォントサイズを表すのによく用いられるポイントはメートルなどと同じような絶対的な単位であり1ポイント=1/72インチで、画面上の最小のドットを表すピクセルは相対的な単位だけれども、Pillowはデフォルトが72dpiなので1ポイント=1ピクセルのように見えるのだと理解して訳を補いました。

第3版で新しく追加されたMatplotlibについては、要点が簡潔にまとめられており、出発点として悪くないです。

この章までで一通りの内容が出揃った印象があります。



Pythonで退屈な作業を自動化する「第20章 メール送信、ショートメール送信、プッシュ通知」の訳後感

訳文はPythonで退屈な作業を自動化するです。

第2版からSMTPとIMAPの詳しい説明がなくなり、プッシュ通知が追加されました。

ntfyというサービスを利用すれば簡単にプッシュ通知が送れることを初めて知りました。

ショートメール(SMS)の送信はやっかいで、私が調べた限り、SMSメールゲートウェイを利用する方法では、日本の事業者と契約している携帯電話へのショートメールの送信をすることはできず、Twilioなど何らかの有料サービスを利用しなければショートメールを送信できないようでした。

Gmailからの送信は、Gmail APIを利用するよりも、アプリパスワードを設定してSMTP送信したほうが簡単かもしれません。



Pythonで退屈な作業を自動化する「第19章 日時、スケジュール、プログラムの起動」の訳後感

訳文はPythonで退屈な作業を自動化するです。

この章は基本的に第2版と同じ内容です。ただし、複数スレッドの話がなくなり、よりわかりやすくなりました。

プロセスやスレッドはOS寄りの低水準の領域であり、退屈な作業を自動化したい事務員などの非エンジニアにとっては難しく感じられるかもしれません。

定期実行が必要になる場面は多いので、タスクスケジューラ、launchd、cronの実行というそれぞれのOSに固有の方法があるということを知っておいたほうがよいでしょう。

時間関係の関数については、エポック秒という考え方と、瞬間的な時刻と幅のある期間の区別を意識すれば、自在に使いこなせるようになると思います。




top