浅野直樹の学習日記

この画面は、簡易表示です

2025 / 12月

Pythonで退屈な作業を自動化する「第22章 画像中の文字認識」の訳後感

訳文はPythonで退屈な作業を自動化するです。

この章は第3版で新設されました。

OCRは進歩の著しい領域であり、実務で必要になることも多いので、この内容が収録されたのは喜ばしいことです。

ただし、英語ではかなりの精度を誇っていても、日本語の精度は劣ります。本文中で示されている『フランケンシュタイン』の日本語訳の認識結果でも誤認識が目立っています。

本文で説明されているようにLLMを活用して修正する余地はあるかもしれません。また、最初からLLMに画像を読み込ませたり、Google Cloud Vision AIを使ったりすれば、日本語の認識精度が高くなるでしょう。

原著者も述べているように、Pythonを使うと高度な技術の詳細を意識せず簡単に利用できるのがいいですね。



令和7年度秋期情報処理安全確保支援士試験に合格しました

令和7年度秋期情報処理安全確保支援士試験に合格しました。

受ける直前までの記事は令和7年度秋期情報処理安全確保支援士試験を受けます、受けた直後の記事は令和7年度秋期情報処理安全確保支援士試験を受けましたです。

手応えと結果がおよそ一致しており、想定通りの形で受験を終えることができました。

 



Pythonで退屈な作業を自動化する「第21章 グラフ作成と画像処理」の訳後感

訳文はPythonで退屈な作業を自動化するです。

画像処理とグラフ作成は大きな分野であり、この章はボリュームが大きかったです。

色とRGBA値といったコンピュータ画像の基礎から説明されているのがうれしいです。

この章で扱われているPillowが使えれば画像関係のたいていの処理はできますし、もし画像認識等でOpenCVを使うことになったとしてもここで学んだ基礎が生きてきます。

原文には曖昧な部分があり、訳す際にサイズの単位であるポイントとピクセルの違いに悩みました。

フォントサイズを表すのによく用いられるポイントはメートルなどと同じような絶対的な単位であり1ポイント=1/72インチで、画面上の最小のドットを表すピクセルは相対的な単位だけれども、Pillowはデフォルトが72dpiなので1ポイント=1ピクセルのように見えるのだと理解して訳を補いました。

第3版で新しく追加されたMatplotlibについては、要点が簡潔にまとめられており、出発点として悪くないです。

この章までで一通りの内容が出揃った印象があります。




top