機械学習は結局全然分かっていないのだが、機械学習モデルを動かすことはできる。
然しそれでもハードルがあり、モデルへの入出力を理解してデータを作ったり加工しなくてはいけない。
Magikaみたいにファイル形式判定とかだったら、ファイル入出力ぐらいの知識でいいのだけど、
書き起こし、音声ノイズ除去、発話部分検出とかだと、オーディオデータの扱いや、そもそも音波や聴覚特性の知識が必要になる。
その辺分からなくても、既存の実装を読んで真似することはできるのだけど、ここも理解していないとなると、自分は何なんだろうという気持ちにもなってくるな……。
いや、勉強しろって話なんですが。

0

If you have a fediverse account, you can quote this note from your own instance. Search https://bookwor.ms/users/KitaitiMakoto/statuses/115954321793012147 on your instance and quote it. (Note that quoting is not supported in Mastodon.)