Python

2025/8/25

Whisperで始める音声文字起こしライフ

「会議の議事録を自動化したい」「インタビューを文字にしたい」といった声をよく耳にします。そんなときに頼りになるのが、OpenAIが公開しているWhisper。音声認識の精度が高く、日本語にも対応しているので、手作業の文字起こしから解放される日も近いかもしれません。今回は、実際にWhisperをインストールして、音声ファイルをテキスト化するまでの流れをざっくりご紹介します。 Whisperをインストールまずは必要なモジュールを準備します。GitHubから直接インストールするスタイルです。 GPUがあ ...

Python

2025/1/27

Python Whisperで音声を文字起こしする方法｜やや高速化を考える

OpenAIが提供する「Whisper」は、音声認識を行うためのオープンソースモデルです。 Pythonを使うことで、音声ファイルから簡単に文字起こしが可能です。 Whisperをそのまま使うと解析速度が遅いため、faster-whisperを使って高速化します。 faster-whisperは、Transformerモデル用の高速推論エンジンであるCTranslate2を使用してOpenAIのWhisperモデルを再実装したものです。以下はGoogle Colaboratoryを利用してCPU利用で、 ...

Python

2023/7/21

Pythonを使ってtsファイルをmp4に変換

Pythonを使って動画のtsファイルをmp4に変換する処理で、ffmpegを使用します。 ffmpegは多くのプラットフォームで利用可能で、動画・音声の変換や編集に広く使用されています。まず、Pythonで外部コマンドを実行するためにsubprocessモジュールを使用します。そして、ffmpegを呼び出して.tsファイルを.mp4に変換します。 ffmpegをコマンドラインから使えるようにインストールし、Pythonスクリプト内でsubprocessを使ってffmpegを呼び出します。 impor ...

Python

2023/4/7

Pythonで知っておくべき10個の概念

Pythonは高水準のオブジェクト指向プログラミング言語であり、その汎用性、動的性質、堅牢性、学習しやすい性質から、多くの学生や専門家によって選ばれています。最近では、JavaScriptに次いで2番目に人気のある言語となり、機械学習、データサイエンス、ウェブ開発、分析、自動化、テスト、人工知能など、ほとんどすべての技術分野で使用することができます。 Pythonの学習は、JavaやC++などの他の高水準のオブジェクト指向プログラミング言語と比較して簡単ですが、堅牢で簡潔、最適化され効率的かつ正規化され ...

Google Python

2023/3/16

Google Colaboratory Pythonを利用してYoutubeの投稿を行う

Pythonを使ってYouTubeに動画を投稿するには、YouTube Data APIを使用する必要があります。これは、YouTubeに対応するRESTful APIです。以下に、必要な基本的な手順を記載していきます。 Google Cloud Consoleでプロジェクトを作成し、そのプロジェクトでYouTube Data APIを有効にする。プロジェクトの認証情報（OAuth 2.0 クライアント ID）を作成し、クライアントの秘密ファイルをダウンロードする。 Python用のGoogle A ...

Google Python

2025/1/21

PythonとWhisperを利用して音声ファイルの文字起こし｜さらにGoogle Colaboratoryで実行

OpenAIが提供している文字認識モデルWhisperを利用すると、Python環境での日本語の文字起こしが可能です。ローカルで実行するのが手間な場合Google Colaboratoryを利用して実行する事が出来ます。まず文字起こししたい音声ファイルを取得し、Google Colabのsample_data配下にドラッグ＆ドロップします。 sample_dataのフルパスはカーソルを当てた時右側に出る3点リーダーの「パスをコピー」をクリックすと分かるのですが、フルパスは"/content/sampl ...

Python

2022/3/23

Djangoのtemplate(標準)でURLエンコード

マニュアルがとても見辛いため探すのに時間が掛かってしまいましたが、他言語のテンプレートエンジンと同じ様に、縦線を利用する事で実行内容を記載できます。 valueの部分がURLを記述する部分で、もしURLが"https://www.example.org/foo?a=b&c=d"のような形式だった場合、出力は次のようになります "https%3A//www.example.org/foo%3Fa%3Db%26c%3Dd" {{value|urlencode}} urlencode Escapes a ...

Python

2022/3/22

Pythonでcurlした時に発生したssl certificateエラー

pythonの一連の流れでcurl実行したかったのでPycURLを使おうとしたらエラー....。やっている事は簡単なので色気を出さずにrequestsでもいいんですが、curl.perform()の実行した際にエラーが発生し、下記のエラー文言が出ました。 python ssl certificate problem unable to get local issuer certificate 見た感じ証明書の問題でしかないのですが、いい対処法はないのかと思って調べていたらcertifiを使う良さそうな対応 ...

Python

2022/3/22

Pythonのbase64デコードで発生したIncorrect paddingエラー

pythonでbase64 デコードしたかったので調べてみると下記の内容が良く出ててきます。 import base64 dec_file = base64.b64decode( enc_str ) これを実行するとIncorrect paddingとエラーが出てしまい、変換出来ない物がありました。不適切なパディングと言われても、変換したかったのはgmailから取得したメール本文のため、何のこっちゃ分からないわけです(笑)。出来ないと困るなーと思い追加調査、どうやらURLの一部として安全に使用するバー ...

Python

条件の0=0は全てが正であるを意味する [SQL]

DISTINCTを使わないで重複排除を考える [SQL]

RFC 5322に準拠させた正規表現言語別