2025-06-29

AIで音声メモを文章整形するための最適なプロンプトを探して、5段階の強度を比較した

LLM 雑記

概要

最近、音声入力でメモを取ることを試している。タイピングに頼らずに、パソコンに向かって話すだけでテキスト化されるのは快適だが、出力は言い直しや繰り返しが多く、そのままにしておくのは少しもったいない。これを綺麗にしようとcursorのAIを叩いてみたが、どうも望む通りの結果が出てこない。
そこでこの記事では、同一の文章に対して複数の文章整形プロンプトを実行して、どのような結果が出るかを実験した。自分のための技術メモの側面が強いが、もし誰かの役に立つことがあれば幸いである。

概要
はじめに文字起こしをAIで上手く整形したい
実験の設定
結果プロンプトと出力結果
考察
- 余談：この作業にObsidianは本当に必要か?

はじめに文字起こしをAIで上手く整形したい

文字起こしのサービスAqua Voiceを使い始めた。精度が高かったので、すぐに有料モードに加入した。そのため、プライベートのメモは1人でブツブツ喋って音声でメモを取ることが増えた。ただしこの方法だと、当然フィラーや言い直しが多い。そこでCursorの出番である。CursorのAIに要約をしてもらっている。いや、要約というのは少し不適当かもしれない……冗長な語を取り除くことをお願いする。しかし、出力文章が予想以上に削除されて短くなったり、逆に削除が不十分で長くなったりと、うまくいかないことがあった。そのため、どういう要約用プロンプトを実行するとどういう結果が返ってくるのかというのを一旦まとめてみたい。
（注意：フィラーとは、「えーと」や「あのー」といった、言い淀んだときに出る言葉のことである。）

実験の設定

サンプル用の入力文

入力となる文章がないと始まらないので、サンプルの例文を用意した、というか自分でパソコンに向かって適当にしゃべった。
（1回目に今日の晩飯について語ったら、Aqua Voiceが不調で途中部分の文字起こしに失敗していた……ショックだ。）

え〜どうしよう、6月だというのになかなかついですね。なんか梅雨入りした本当は梅雨入りしたことは知っているんだけど、梅雨はどこに行ってしまったのかといった感じのお天気である。今日も晴れて最高気温は33度ぐらいになったと思う。夕ご飯を食べた後に軽くジョギングに行きました。今日もリモートワークだったので、家からほとんど出ないと全く運動不足になってしまうから。まあ、というわけで、夜に本当に軽いジョギングに行ったんだけど、夜に走っても結構汗ばむくらいの気温であった。確か研究法によれば少しは雨になるらしいが、ちょっと確認してみよう。研究法を確認してみたら、明日は曇りのち雨だ。久しぶりに雨が降るみたいだ。

Aqua Voiceは喋った結果の音声ファイルを内部で保存しているので、聞き返してみた。Aqua Voiceは結構フィラーを削除してくれる。実際の音声ではもっと「えーと」「まぁ」といったフィラーが多い。

なお、上記には少し文字起こし誤りがある。

「なかなかつい」→「なかなか暑い」
「研究法」→「天気予報」

今回はこのままcursorに入力してみよう。

モデル

これは俺の用途の関係上、cursorのエディタ内部で使えるモデルから選ばなければならない。
現状（2025年6月23日現在、cursor 1.1.3）エディタ内部のAIで使えるモデルは以下の通りになっている。

claude-3.5-sonnet
gpt-4.1
claude-3.7-sonnet
gpt-4o
cursor-small

Text Arena | LMArena とかを調べたけど、claude-3.7-sonnetよりもgpt-4.1のほうが全体的な性能が良いんですかね? gpt-4.1 を使うことにする。

要約するためのプロンプトを考える（作ってもらう）

文字起こしの方法は、「素起こし」「ケバ取り」「整文」という3種類がある。

「素起こし」とは、録音した内容を聞き、聞こえた音をそのまま一字一句正確に書き起こす方法です。
「ケバ」とは文脈上意味を持たない「あのー」「えー」「ああ」「～ね」「～よ」などの言葉を指す用語であり、「フィラー」と呼ばれる場合もあります。
（中略）ケバをきれいに取り除くだけで文章がスッキリし、非常に読みやすくなるのです
「整文」とは、話し言葉を書き言葉に直し、文体をですます調に整える方法です。助詞の補充や、ら抜き言葉の訂正などを行うので、非常に美しく読みやすい文章に仕上がります。
「素起こし」「ケバ取り」「整文」の違いを理解しよう！ | コラム | VoXT One（AmiVoice）

ただ「整文」は「要約」ではないんだよな。「整文」は原文にあった意味が欠落する加工ではないはず。

Gemini 2.5 Pro 他に「入力された文章を整えるためのプロンプトを考えて出力して」と言って、プロンプトを作成してもらった。
下記の結果とセットで記載している。

結果プロンプトと出力結果

5個のプロンプトと実行した出力結果を示す。（他にも試してみたが、上手くいかなかったものは省略。）
一応、元の文章の前後の部分が結果に影響する可能性があるため、新規ファイルを開いてそこに上記のテキストを貼る形で検証した。

レベル1

プロンプト：
フィラーや言い淀みを除去し、誤字脱字を修正して、自然な話し言葉として整えてください。
結果：

どうしよう、6月だというのになかなか暑いですね。梅雨入りしたことは知っているけれど、梅雨はどこに行ってしまったのかという天気です。今日も晴れて、最高気温は33度くらいだったと思います。夕ご飯を食べた後に軽くジョギングに行きました。今日もリモートワークだったので、家からほとんど出ず、全く運動不足になってしまうからです。夜に軽くジョギングに行ったのですが、夜でも結構汗ばむくらいの気温でした。確か天気予報によれば少しは雨になるらしいので、確認してみたら、明日は曇りのち雨だそうです。久しぶりに雨が降るみたいです。

レベル2

プロンプト：
口語は残しつつ、全体のフィラーや言い直しを除去し、多少文脈を調整して自然な話し言葉に整えてください。
結果：

どうしよう、6月なのになかなか暑いですね。梅雨入りしたことは知っているけど、梅雨はどこに行ってしまったんだろうという天気です。今日も晴れて、最高気温は33度くらいだったと思います。夕ご飯のあとに軽くジョギングに行きました。今日もリモートワークだったので、家からほとんど出ず、運動不足になりそうだったからです。夜に走っても結構汗ばむくらいの気温でした。天気予報によると、明日は曇りのち雨らしいです。久しぶりに雨が降るみたいですね。

レベル3

プロンプト：
冗長な表現や遠回しな言い方を、より簡潔で分かりやすい表現に修正してください。
結果：

6月なのに暑い日が続いています。梅雨入りはしているはずですが、雨が降らず晴れて最高気温は33度ほどでした。夕食後に軽くジョギングをしましたが、夜でも汗ばむほどの気温です。リモートワークで運動不足になりがちなので、夜に走るようにしています。天気予報を確認したところ、明日は曇りのち雨で、久しぶりに雨が降るようです。

レベル4

プロンプト：
口語的な表現を書き言葉に直し、文章の構成を整えてください。要点が明確に伝わるようにしてください。
結果：

6月にもかかわらず、連日暑い日が続いています。梅雨入りしたことは知っていますが、梅雨らしい天気にはならず、今日も晴れて最高気温は33度ほどでした。夕食後には軽くジョギングをしました。リモートワークのため外出する機会が少なく、運動不足になりがちだからです。夜に走っても汗ばむほどの気温でした。天気予報によると、明日は曇りのち雨で、久しぶりに雨が降るようです。

レベル5

プロンプト：
文章の要点のみを抽出し、簡潔な文章で再構成してください。元の表現にこだわる必要はありません。
結果：

6月なのに暑い日が続き、今日も最高気温は33度だった。リモートワークで運動不足を感じたため、夕食後にジョギングをした。天気予報によると、明日は久しぶりに雨が降る見込み。

考察

どのようなプロンプトを作れば結果がどこまで短くなるか、予想通りにはいかず、調整が難しい。
レベル3とレベル4の結果がそんなに変わらない長さだった。レベル5で一気に短くなったので、4と5の間の縮約になるプロンプトが作れないか少し試したけど、上手くできなかった。

また、文体についても改善の余地はある。今回は、「ですます調にしろ」とか「箇条書きにしろ」のような特段のスタイルの指示をしないようなプロンプトにした。希望する文体があれば当然それをプロンプトに入れる方が良い。
例えば下記の記事には、2人がしゃべっているPodcastの文字起こしに対して、特定の形式で出力をしてもらうためのプロンプトがある。
ポッドキャストをAIで文字起こしして図解する手順｜ノウチ
上記では、出力形式や実行すべき処理をかなり具体的に指示している。
今回の実験はプロンプトがシンプルであることを優先したので、割と短めのプロンプトにした。

先程の「素起こし」「ケバ取り」「整文」との対応関係を見ると、もう文字起こしをした段階でフィラーはある程度削除されているので素起こしにはならない。
「ケバ取り」はフィラーを除去して最低限きれいにするくらいなので、レベル1の結果だろう。
「整文」がどれに当たるかは、どこまで文を整理したいかによる。レベル5まで行くともはや別物なので、レベル2〜4のどれかだろう。

応用としては、例えば各レベルのプロンプトを辞書登録しておいて、すぐに呼び出せるようにしておくことが考えられる。「ケバ取り」をしたいときはcursor上でレベル1のプロンプトを呼び出して実行すれば良い。

今回の実験の限界について。モデルは今回gpt4.1だけにしたが、このモデルが違うと当然結果が違う可能性はある。さらに元の文章も1つしか無い。あとはAqua Voice以外の文字起こしだとそもそも入力文が変わってくるな。（仕事のときはWindows標準の音声入力をつかっているが、アイツはフィラーを入れてくるし、やたらと句読点を入れてくる）ちゃんと定量的に議論しよするには、複数のモデルで複数回実験して……とやる必要があるが、学術論文でもないので簡単な実験でとどめておく。

余談：この作業にObsidianは本当に必要か?

考えてみると、今回の作業をするうえで使っているツールは3つある。Aqua VoiceとObsidianとCursorの3つだ。この3つのツールの担当範囲を箇条書きにすると、こうなる。

Aqua Voice：入力された音声を文字に起こす
Cursor：AIを呼び出し、プロンプトを実行して文字起こしを整形する
Obsidian：デイリーノートの作成と保存

しかし、この3つの貢献度合いは明らかに違う。私が喋った内容が精度高く文字起こしされるのはAqua Voiceのおかげである。私の言い回しが適宜省略され、簡潔に冗長な箇所が削除されて簡潔になるのはCursorとその向こうのAIのおかげである。

ここでObsidianは何をしたかというと、特に何も貢献していない。テキストファイルを扱えるエディタでありすれば良いので、別にObsidianではなく、他のエディターでも良い。例えば使い慣れたVS Codeでも別に問題はない。
強いて言えば、Command+Shift+D のショートカットキーでデイリーノートが開くように設定したので、Obsidianの恩恵は「ショートカットキー一発でデイリーノートを作成して開ける」ことかもしれない。だがそれだけでは、あまりにも小さすぎるのではないか。Cursorの良さはわかるし、Aqua Voiceの良さはわかるけど、Obsidianの良さは未だによくわからない（VS Codeでも良いじゃん）というのが、現時点での私の考えである。

2025-04-06

CNBC「AIのVibe Coding時代」を見たメモ

雑記

CNBCのYouTube動画を観たので、ちょいと感想を書く。
動画はこちら。

www.youtube.com

CNBCをチャンネル登録しているのは英語学習のためだったが、そこから「Vibe Coding」というフレーズの動画が出てきたのでびっくりした。
AI駆動開発、またはVibe Codingってやつがプログラマーの間ではいま激アツである。QiitaやZennみたいなプログラマー向けサイトにこの話がいくら出てきても俺ももう驚かないんだけど、一般向けチャンネルであるCNBCで取り上げられていて驚いた、っていうのが今回書こうと思った理由。
ただ、全部通して観たわけじゃなくて、動画が40分ある中で前半15分のニュース部分だけ視聴した。後半20分くらいはAbridgeってサービスのCEOとの対談だったからスキップした。
タイトルを見たときはAI駆動開発やコーディングの話に限定した話だ思っていたら、観た感じだともう少し広い内容でちょっと予想外だった。タイトルが一点集中しすぎだろ、と思った。

内容は大きく二つの対立構造で語られていた。
ひとつは汎用モデルを作る側。ChatGPTのOpenAIとか、Claudeを作るAnthropicとか。もう1つは、AIラッパーとかAIアプリと呼ばれる側。コードならCursorやWindsurf、法律ならHarvey、医療ならAbridgeが伸びているらしい。
Googleみたいなビッグテックは既存の収益構造があるから急な方向転換が難しく、既存ビジネスを壊すリスクがある。一方、小規模スタートアップや特化サービスは自前でモデルをファインチューニングして素早くサービスを立ち上げ、急成長できる。という二項対立の構造のようだ。
最初は優れた万能のAIモデルを作ることに注目が集まって、投資の資金も流入した。けれど、最近はAIラッパー、AIアプリに金が流れている。
とはいえ、どちらが善でどちらが悪って話でもなく、ビッグテックも資金力と既存基盤で反撃してくるかもしれないし、これからどう転ぶかはわからない、って感じだった。

具体的なサービス名が結構バンバン出てきてたのでメモしておく。

コード系
- Cursor
- Windsurf
- Replit
- Devin
音声系（会話）
- Sesame
AI エージェント
- Manus ── 中国製。次の DeepSeek? とも言われ、ウェイトリスト 200 万人。
法律系
- Harvey OpenAI内に事例紹介あり法務分野に特化したカスタムモデルを構築 | OpenAI
医療系
- Abridge

最近ブログを全然書いていないので、軽い記事としてまとめてみた。この原稿を LLM で整形して、最後に目を通してアップする予定。おしまい。（ChatGPT o1に推敲を頼んで、各サービスへのリンクを貼っといてと言ったらやってくれた。一応確認したけどちゃんと合ってるな。）

2025-03-13

英検1級（2024年度第3回）2次試験面接の質疑メモ、振り返り

英語

2025年3月2日（日）に英検2次試験を受けたので振り返りメモ。（2024年度第3回）
ギリギリ合格だった。

試験開始まで
入室〜フリートーク
スピーチ準備
スピーチ
質疑
反省（帰宅しながら色々思ったこと）
- トピックをどう解釈すべきか?
- スピーチについて
結果発表！
感想
関連記事

試験開始まで

案内ハガキには「10時15分に集合（時間厳守）」と言われて、ほぼギリギリに着いた。
あ、そうだ。控室に入ると携帯電話の電源は切らなければいけない。（使用すると不正行為に当たる）このことを覚えていなかったが、電車で移動中に面接用の文章のAnkiカードを完了させておいたので良かった。次回も忘れずにそうしろよ、俺。
案内係の女性が「10時40分から試験開始である。ただし。会場には3つ部屋があり、この部屋は3番目である。したがって試験までにはしばらく時間がかかる」という話をしていた。3番目の部屋の中でも私は最後の方に入室したので、私が試験を受けたのは12時の少し前だった。
結構長時間待つことになるが、上述の通り携帯電話は使えないので、勉強するならノートや参考書が必要。

入室〜フリートーク

というわけで会話の内容をメモ。

※ 注意：ここからは一応、私が言おうとした内容/会話の内容を日本語で記述していますが、おそらく英語はこれよりもだいぶ崩れている。また、言い直しも結構多かったと思います。

試験前の前置きフェーズ。「自己紹介をお願いします」
「ITコンサルタントしてます。AI関連の部署にいるので、毎日AI関連のニュースが出てくるのに追いつくのが大変ですが、楽しいです」
「休日は何をしていますか」
「ゲームしたりYouTubeみたりしています」

自分の仕事内容についてはどこまで答えるかよくわからなくなって、だいぶごちゃっとした（=文構造が崩れた）答えをしてしまった。
そもそも自己紹介をしろと言われていて、自分の仕事について述べよと言われているわけではない。せっかくなら「1回2次試験で落ちたので、次に今回は成功できるようにベストを尽くします」と言うとか、「ゲームを英語の字幕でやっていると英語表現が身に付いて面白いです」とか、言えばよかったかもなぁと今になって思っている。
休日の過ごし方については、無難に「ゲームをしてYouTubeを見てます」と答えてしまった。

スピーチ準備

「では試験を始めましょう」

というわけでトピックを選んで+スピーチ準備の1分間。

https://www.eiken.or.jp/eiken/exam/grade_1/

ここにはサンプル問題があるけど、実際はこれよりかなり長い文章だったと思う。旺文社から出てる過去問を見れば実際に過去に出題されたトピックカードが見られるんですかね?

トピック1は発展途上国とか書いてあった気がする。国際関係は行けそうになかったのでパス。
トピック2か3で、なんか見て分からない単語があった気がするんだよ。あとセレブがどうとか書いてあった気がして、この辺はマジでわかんないからパス。
Twitter検索したら「若者は伝統文化に無関心か」というのが出てきた。うん、2か3のどちらかがこれだったかもしれない。
トピック4が私の選んだやつで、就業可能な最小年齢を引き下げることは労働者に良い経験をもたらすか
トピック5は確か技術的な発展が将来にわたって永久に続くかみたいなこと

4と5でだいぶ迷う。5番は「YES」と答えれば良さそうだと思ったけど、理由が2つ思いつかなかったので4番にした。
労働関係のトピックはよく出るので、週4日労働制度・男女の格差・リモートワークなどあたりかなと思ったけど、まさか就業年齢の引き下げについての問題が来ると思わなかったので驚いた。
注意点として、valuable experienceという書き方をしていたので、これは会社の立場や政府の立場で答えてはいけない。聞かれたことに対して正しく答えなければいけない。

スピーチ

「一部の人は、就業可能な最小年齢を引き下げることは労働者に良い経験をもたらすと考えていますが、私はそうは思いません。その理由は2つあります。
第一に、（価値ある業務には前提の知識が必要的なことを言えたかなぁ……自信がない。）私の個人的な経験から言えば、私のいまの業務は大学で学んだことに基づいています。若い年齢で働いても、単純な繰り返しの業務をすることになり、これは価値のあるものとは言えません。
第二の理由として若い人が搾取されると言う可能性があります。自分の会社は悪意を持っていたり、人を騙そうとしていたりするかもしれません。若い労働者は判断力がそれほどないので、そのような会社に搾取される危険性があります。
結論として、就業可能の最小年齢を引き下げることは良い考えではありません。」

第二の理由を言い終わったあたりでタイマーが鳴ったので、「あれ、スピーチを終わったほうが良いの?」と思った。だが制止されなかったので、最後に簡単に結論部分を喋って一応スピーチを終わらせた。

質疑

日本人の試験官「Q. 今、日本では伝統的（traditional）の産業に従事する人が少なく、政府も産業の保存のために取り組んでいます。農業や漁業といった業界の労働者が不足しています。例えば、若い人が今すぐ農業や漁業に従事して働きたいと言った場合、働いてもらうのは良い考えですか。」

下のカッコ内は俺がその場で思ったことです。
（この面接官すごいしゃべるなぁ……traditionalというと俺の好きな江戸切子や日本酒の話をすればいいか。いや待てよ。農業や漁業の話なのかー。肯定してもいいけど、そうするとスピーチの自分の内容と矛盾するから、否定で回答するのがいいか。）

「難しい質問だが、私はそうは思わない。農業は機械化されていますし、現代の農業は関連する理論に基づいています。まず学校で農業の技術などを習得して、それから実際に農業に従事して働けばいいと思います。」
機械化されているから単純労働の必要性は薄い、みたいなことを言いたかったんだと思うけど、多分そこまでちゃんと筋道通った話をできていなかったと思う。

ネイティブの試験官「Q. 貧しい家庭で大学に行けない学生の場合はどうしますか。大学の授業料は、無料では無いですよね。」

「そうですね。高校卒業してから大学に行かずに働き始めるというのは特に問題ないと思っています。その場合は彼らは18歳になっているわけですし、基本的な判断力はあるでしょう。しかしまだ若く判断力が不足することもあると思うので、彼らが搾取されないように、若い労働者を守る法律の整備が必要だと思います。」
あんまり同じ話で終わらせるのは良くないなと思ったので法律の話を最後にくっつけた。enforce lawsという言い回しはAnkiで覚えておいてよかった……。

ネイティブの試験官「Q. 若者が搾取されるというのはあなたのスピーチでも述べていましたね。法律以外にできる対策はありますか。」

（若者がそういう状況に置かれたときに、自分から訴えることが必要で、だとするとえーと……あ、教育だわ。よしこれでいこう。）

「A. 1つの選択肢は教育だと思います。高校等の授業で労働のシステムについて教えておけば、学生が高校を出て働き始めた後で自分の環境が劣悪であった場合、その状況に自分の状況に気づくことができて苦情を提出できると思います」

The problem should be educated to the student in high schoolsとか言ってしまって「あ、マズい」と思ったけどそのまま押し通した。（educateの目的語は人物なので不可。taughtが正解。）
あと最後「file a issue」とか言っちゃったな。いま英辞郎を検索したら「file a complaint」あたりが正解っぽい。

ここで時間終了となった。

反省（帰宅しながら色々思ったこと）

トピックをどう解釈すべきか?

就業可能の最小年齢の引き下げと言うテーマなので、これを落ち着いて考えてみると、よく分からねぇなと。
日本の法律を考えると、就業可能な最低年齢って15歳じゃないですか。これは引き下げようっていうことなのか……? だとすると「中学生が働くことになり、義務教育の機会が奪われるから問題です」の一択になりそうな気がする。
でもいま高校進学率は90%を超えているから、最小年齢で働き始める人ってほとんどいないし、最小年齢を上げ下げすることによる効果はほとんど無さそうだし……。自分でも何歳から何歳に引き下げる話をしているかよくわからない……と思いつつしゃべっていた。
そもそも問題文では日本の話に限定されていなかったので、一般論で答えるべきなんだろうか。日本の話として喋りますと前置きして、日本限定で語っても良いのかな……? よく分からん。

スピーチについて

せっかく個人的な経験を語っているので、大学で情報工学を学んだとか、プログラミングの知識とかもうちょっと具体的なことを言っても良かったと思った。
「私の個人的な経験から言えば、私のいまの業務は大学で学んだことに基づいています。」だと具体的にどう基づいているのか分からないからね。

農業は機械化されている……は、直前に見てた参考書から思いついたものだったので、最後に粘って勉強したのも無駄ではなかったと思う。多分。

結果発表！

ギリギリで合格してた。

SHORT SPEECH 6
INTERACTION 7
GRAMMAR AND VOCABULARY 7
PRONUNCIATION 6

合計26 / 40。これがギリギリで受かるスコアですよ皆さん。 CSEスコアの合格基準が602で、これがCSEスコアが605だった。多分

前回（2024年度第1回）は上から4-6-4-6で不合格だった。我ながら酷いスコアだ。比較すると、SHORT SPEECHとGRAMMAR AND VOCABULARYが主に伸びたということだな。

感想

改めて振り返ってみると英検1級2次試験は間違いなく難化したと思います。今回含めて5回受験していますが、今までで1番トピック選びに苦戦しました。お題がよりニッチになったこと、トピック文が長くなり複雑になった事が考えられそうです。この事を鑑みると今後英検1級2次試験を対策するには参考書や過… https://t.co/OFqUHQ3L5F
— とげまる| 和田啓 (@KTogemaru) 2025年3月4日

英語学習と英検受験を長年続けているとげまるさんが書いている通り、トピックが難しかった。
どれもこれも変にひねったトピックに見えた。素直なトピック、例えば「週4日労働に賛成か反対か」みたいなのはもう出題されないのかな?

最後の質問の教育は「困ったときの教育だな」と思いつつ答えていたが、「困ったときには○○の観点から回答すれば良い」という観点を13個リストアップしている記事を見つけた。
確かに答える観点はある程度似てくるので、いくつかの観点を用意しておけば良いという作戦は納得である。これはいくつか頭に入れておくと便利かもしれない。

note.com

答えられるようにしていた（つもりの）トピックは「インターネット、フェイクニュースと陰謀論、メディア」あたりと「労働問題、働き方」あたりの2点くらいだった。
この辺に山をかけていたわけだ。次はもうちょっと対応可能なトピックを増やしておこう。

試験対策の勉強法などは書きませんが、せっかくなので使った参考書を下に貼っておきます。
それでは。

出る順で最短合格！英検1級単熟語EX 第2版

作者:ジャパンタイムズ出版,ロゴポート
ジャパンタイムズ出版

Amazon

英検1級面接・攻略ポイント20 英検面接・攻略ポイント20

作者:アスク編集部
アスク

Amazon

linus-mk.hatenablog.com

2025-03-02

生成AIと音声認識によるブログ執筆、お試し_1

雑記

2025年3月2日 18:19

いつものように仕事の合間にはてなブックマークを見てたら、面白そうな記事が流れてきたので、ちょっとやってみることにするよ。
まぁ何せ今年に入ってから、気がついたら全然ブログ書いてなかった。なるべく適当に書くようにしないともう全然書かなくなっちゃう。

下記の3つの記事をざっくり読んだ。

honeshabri.hatenablog.com umiyosh.hatenablog.com anond.hatelabo.jp

使用環境は、人によってそれぞれ違うから、記載しておこう。

パソコンは割と古いMacBook Pro（2019）
スマホは2021年10月購入に買ったOPPO Reno5 A（Android）
Obsidianは使ってない、Evernoteは不便になりすぎてやめた、ちょっとだけNotion使っている

「忙しい人向けの説明」のセクションがマジでわからない。

「本しゃぶりというブログにChatGPTの使い方について、面白そうな記事があったのでメモ。なんか音声入力を使うといいらしい。これまで話した内容について整理し、マークダウンで出力して」と喋っておこう。誤字脱字などの修正をせずに投稿すればいい。

「これまで話した内容」と言うのは、一体どこを指しているのか。一連の会話の末尾でやれと言ってるのかよくわからなかった。
とりあえず言われるがままに、Android版のChatGPTに吹き込んでプロンプトを投げたら、私がこれまで入力してきた結果に基づくメモリに残ってる情報（英語学習やキャリア関連など）が出てきた。それが期待した通りになってるのか、よく分からない。

以下、私が喋る→SuperWhisperで出力されたテキストをコピー →

以下は、私が1人でしゃべった内容を音声認識に入力した結果です。言い直しやフィラーを修正し、自然でわかりやすい文章に修正してください。

と ChatGPTに指示→結果を少し手直ししたもの。

SuperWhisperをダウンロードしてみた。公式ページに

https://superwhisper.com/ You can try the Pro features for 15 minutes free, after that the free tier features are available to you forever. The no questions asked refund within 30 days of purchase will always be honored.

と書いてあるとおり、最初の15分間だけプロモード（有料版）を使用できるらしい。では、無料版ではどうなるのか？ 15分経過後に検証しようとしたが、説明をよく読むと厄介なことに気がついた。

まず、私のMacBookが古いため、インテルチップ搭載のMacではクラウド版が非対応で、ローカル版のみで動作するという制約がある。そして第二に、クラウド版の機能を使えるのはプロモード（有料版）だけだという。つまり、15分が経過して無料版に切り替わると、私はこのソフトウェアを一切使えなくなる。終了。詰んだ。

もちろん、月額8ドルを払ってProモードにすれば解決する話ではあるが、使い始めて今すぐ課金する気にはなれない。しかし、Macのデフォルトの音声認識がまったく満足のいくものではないのも事実だ。私は話し始めに「まぁ」という単語をよく使うのだが、これがほぼすべて「もう」と誤変換されてしまい、かなりイライラする。

検証して気付いたが、開始から15分が経過したらProモードのお試しが終了するのではなく、15分間の音声を入力したあとという意味らしい。

それはさておき、議事録について思い出した。会議中にメモを取るが、最終的な議事録は構造化された文章になる。しかし、人は最初から整理された形で話すわけではなく、「A」という議題について話していたつもりが、途中で脱線して「B」について議論していることもよくある。そして最終的に「Aの結論って何だったっけ？」と話が戻る。そうなると、議事録では発言順ではなく、話の流れを整理して「Aの結論」としてまとめる必要がある。

同じように、最終的に出来上がるブログの文章も、議事録と同様に構造化したい。しかし、話した順番そのままでは構造的な文章にはならない。そこで、この作業をAIに任せて、大規模言語モデル（LLM）に構造化をさせるのが良いのでは、ということだと理解した。

さて、どうしたものか。SuperWhisperを活用できるのは15分間だけのようで、非常に困っている。15分を超えたら検証が続けられないからだ。その後の代替策としては、Googleドキュメントの音声入力を使うのが良いのかもしれない。または、ChatGPTに直接話しかけるのもありか？音声認識の精度がどれほど高いかが、最終的にLLMに渡るデータの質を左右するのだろう。

うーん、どうしようか。このまま投稿してしまうか……。

2024-11-24

［論文メモ］M3DocRAG: Multi-modal Retrieval is What You Need for Multi-page Multi-document Understanding

論文雑記

画像も文字も表も全部まとめて理解するRAGシステムの提案 Bloombergなど | AIDB

で論文紹介を見かけて、RAG関連の業務を実施している俺としては気になったけど、AIDBって有料会員にならないと読めないのね。というわけで、自分で何とかすることにした。

論文のArXivリンクは下記： arxiv.org

注意: ChatGPTの無料版（GPT-4o）にPDFを入力して質問しつつ理解したものですが、記事の文章自体は（引用の1ヶ所を除き）全文俺自身が書いています。

どんな論文?
先行研究と比べてどこがすごい?
技術や手法の肝はどこ？
- 2) Page Retrieval （ページ検索）
- 3) Question Answering （質問応答）
議論はある?
Figure 6 をよく調べる
おまけ：

どんな論文?

M3DocRAG というRAGを提唱。複数文書や複数ページの文書に対応していること、テキストだけではなくその他の視覚情報（図や表など）を読み取れることを特徴とする。
また、評価のために新たなベンチマーク「M3DocVQA」を提案。40000ページ・3000ファイルのPDF文書（WikipediaをPDF化したもの）のDocument visual question answering (DocVQA)のベンチマーク。

先行研究と比べてどこがすごい?

(a) Single-page DocVQA → 単一ページに関してvisual question answering (VQA)をしているから、複数のページ/文書に対応できない。
(b) Text-based RAG → OCRで文字情報だけを読むから、図や表などの情報が欠落する。
(c) M3DocRAG (Ours) →上記2つのいいとこ取りをしました。つまり多くのページやファイルを扱えるし、図や表などの情報（visual information）も扱える。

こう並べてみると、いいとこ取りをしようという発想になるのは自然な気がする。

技術や手法の肝はどこ？

提案手法のM3DocRAG は3つのステップからなっている。

1) Document Embedding （ドキュメントの埋め込み計算） ColPaliというvisual embeddingを使って、PDF文書の各ページの埋め込みを軽鎖する
2) Page Retrieval 質問文に近い上位Kページを抽出するんだろう。細かい手法は分かってないけど。
3) Question Answering マルチモーダルのLM （例えば、Qwen2-VL）を使って、最終的な答えを得る。

論文にするほどの価値（新規性）って何なんだろう? と疑問に思っている。文書ファイルを画像の形のまま埋め込みベクトルに変換できて、クエリとの類似性を計算できるのであれば、それを使ってRAGを作れるのは当然に思える。すごいのはColPaliであってM3DocRAGでは無いのでは?

「ColPali」で検索して出てきたこの記事も、この論文が出る前の時点だけど、類似度計算してRAGを作っているようだし。
Qwen2-VLとColPaliでマニュアル用ローカルQAボットを作ってみた

2) Page Retrieval （ページ検索）

入力クエリと各文書との類似度を普通に計算しようとすると、文書の数だけ計算する必要があり、計算コストが高い。 IVF（Inverted File Index）という方法を採っているらしい。

文書に対してembedding計算→クラスタリングをする。
入力クエリが来たら、各クラスタの代表点ベクトルとの類似度を計算する。
入力クエリと近いクラスタに対して、クラスタに属する各文書との類似度を計算する。

類似度を計算する対象の文書が大幅に減るので、計算時間が20s→2sくらいまで減る。
精度はちょっと落ちるけどそれほど顕著な性能劣化ではないので、計算時間の大幅減のほうがメリットが大きいでしょう、ということらしい。
Oracle が出してる記事が図が多くて分かりやすかったのでそちらを参照。
Inverted File Flatベクトル索引の理解

3) Question Answering （質問応答）

ColPaliのembeddingとQwen2-VLのembeddingは別物らしい。

The visual encoder takes K-retrieved page images P_K^q as inputs and outputs visual embeddings (different from ColPali encoder’s outputs).
論文 2.3

ChatGPTに聞いたら↓のように返ってきたけど、論文中にここは書いてないと思うし、真偽のほどは分からない。

ColPaliの埋め込み空間とQwen2-VLの埋め込み空間は異なります。

ColPaliは検索タスクの類似度計算用に最適化されており、その埋め込みは視覚情報だけを重視しています。

一方、Qwen2-VLは、視覚情報とテキスト情報を統合して自然言語の形で回答を生成することを目的としており、埋め込み空間が異なる設計です。

議論はある?

この論文にはDiscussion の章が無いので、該当するのはラストのConclusionの後のLimitations 部分ですかね。

元の検索モデル・言語モデルが英語中心のデータセットで訓練されたので、英語以外で書かれたドキュメントやプロンプトで性能劣化する懸念。
誤った/偏った結果が出力される可能性がある→実運用では人間の監視が必要。

Figure 6 をよく調べる

Question: "What distance was the AP Warrior fast race at the Del Mar Racetrack?"
ColPali + Qwen2-VL 7B: "Seven Furlongs"
質問: AP Warrior（競馬の競走馬の名前）がDel Mar Racetrackで走った際のfast raceの距離は何か?
ColPali + Qwen2-VL 7B の回答: "Seven Furlongs"

表の中で Track = Del Mar Racetrack である記録は2つあるから、どっちか分からなくない? と思ってしまった。
もう一つCondition = fast という条件があって、それを満たすのはオレンジで囲った下から2番目の行しか無いね。
Condition って何だよと思ったけど、馬場状態 - Wikipedia / Going (horse racing) - Wikipedia の話らしい……競馬1ミリもわからん。

おまけ：

論文を読む際の落合陽一フォーマットを使った。プロンプトは下記から拝借した。
論文読みフォーマット by 落合陽一 for ChatGPT - work4ai

論文名で調べると、最初に挙げたAIDB以外、LLMが要約したと思われる記事ばっか出てきてちょっと困る。あんまり理解の助けにならないページが検索上位に来るのはどうなんだ。
まぁ、だからこそ、AIDBみたいなサイトが価値を持つのかもしれんが……
それでは。

2024-08-18

「最後の英単語」リストを避けるべき理由：英単語の選定・日本語訳の問題点を徹底分析

英語雑記

「最後の英単語：約20000語の英単語リスト」というものがインターネット上にある。
https://l-formula.com/last-words
今回、このリストのうち1000語をAnkiを使って単語カードにして覚えた。その結論がこれだ。

結論：この単語集を使うのはやめとけ

これだけ覚えて帰ってくれれば問題ないです。
どこがどう良くないのかを詳しく知りたいという人向けに続きを書いていきます。

「最後の英単語」を使って単語を覚えた状況について
英単語の選び方がおかしい
和訳がおかしい
発音が間違っている
総評：ただより高いものはない。単語帳の本を買いましょう。
この妙な誤字はどこから来たのか（どの辞書を使っているのか）

「最後の英単語」を使って単語を覚えた状況について

使い始めた動機について。どこで初めて知ったのか今となっては思い出せない……
無料で入手できる大学レベルの英単語一覧とその語彙レベルあたりを見ていて、「10000語英単語リスト」とかでいろいろ調べていて、偶然見つけたんだと思う。

使い方については、今年（2024年）の1月にAnkiに入れて、ひたすら英語→日本語を回した。
（Ankiでの学習方法については、この記事で紹介しないので、他の人の記事を見てください。）
以下の記事を書いたときに単語数を測定したときには9200程度だったので、9001〜10000が妥当かなと思い、この1000語を覚えた。
linus-mk.hatenablog.com

さてこのサイトの説明には、

総計19511単語の英単語について、英単語・意味・発音記号を重要度順に並べた英単語のリストです。

と書いてある。英単語が1つ、それについて和訳を表示、というシンプルな形式である。
したがって、（発音記号を無視した場合）この英単語リストが良くないと批判する理由は、英単語の選び方がおかしいか、和訳がおかしいか、その両方か、である。
そして実際、その両方なのだ。
というわけで、以下「英単語の選び方がおかしい」「英単語の和訳がおかしい」に分けて詳述する。（以下の説明中で、9001〜10000はサイト上の単語に付記されている番号である）

英単語の選び方がおかしい

全体的なレベル感

フォローしておくと、9001〜10000のレベルは平均的には英検1級くらいの語彙が多いと思う。例えば、以下は英検1級の単語帳（EX英単語帳）にも登場する単語である。

vigil（9002）
debris（9003）
dissuade（9020）

私が英字新聞を読んでいたりして一度調べた単語（exuberance, flimsyなど）もあり、全部が全部ダメというわけではない。一部の単語がダメなのだが、その一部が決して少なくない割合なのである。

固有名詞が少なからずある

国名と地名が結構ある。あと神話の人物が結構ある。こんな感じだ。英単語の勉強ではなく地理か神学の勉強になってしまうから、サッサと学習対象から除外した。

Aphrodite（アフロディーテ：ギリシャ神話の女神）
Brazilian（ブラジルの）
Copenhagen（コペンハーゲン、デンマークの首都）

異常に簡単な単語がある

この9001〜10000のセクションにあった中で最も簡単な単語は、おそらく、bus, menu あたりだろう。
普通に英単語を覚えていって、9000単語覚えるまでにbusとmenuを覚えてないってこと、あるか??

あとは派生形の単語を派生元の単語と1つにまとめなていないので、元の単語を知っていれば容易に推測できる単語がやたらとある。
winner（9059）、buyer（9112）、normally（9302）、undeveloped（9806）などなど。このへんはわざわざ覚えなくても良いでしょう。

異常に難しい単語がある

かと思うともう一方で、やたらと難しいというかマニアックな単語がある。

phalanx 古代ギリシャ軍の方陣
chancel (教会堂の)内陣(聖職者・合唱隊などの席)

など。気合で覚えたけど、これが文章中で出てくることはあるんだろうか。古代ギリシャに関する文献を読まないとほぼ出てこないと思うが。 thrush（ツグミ）もあったが、別に俺は鳥類学者になりたいわけじゃないんだが……。

ちなみに何に基づいてこの単語が並んでいるかというと、以下のように説明されている。

単語選定の方法
Project Gutenbergを用いたRank決定
Project Gutenbergという、著作権の切れた文書をインターネット上に公開するプロジェクトがあります。
これを利用して、単語の出現数を調べ、頻出のものが重要になるようにしてあります。
https://l-formula.com/last-words

基本的には、文章がたくさんあり、その中での単語の頻度順に並んでいるということだろう。
busとmenuとphalanxとchancelが同程度の頻度で出現する文章、どういうものだろうか。

ここまで「英単語の選び方がおかしい」話であった。しかしこれに関しては、「変な単語だな」と思ったら、Ankiを使っている場合は除外すれば問題が出なくなるからまだ良い。ここからは英語に対応する日本語がおかしいという話なので、そうもいかない。

和訳がおかしい

和訳がおかしい話。なお、この「最後の英単語」がどこから和訳を利用しているかという話については、最後のセクションで述べる。

誤字が非常に多い

中でも一番目立つのは誤字である。こんなに誤字脱字が多いことってある? と言いたくなるくらい多い。
1000単語の中で30個以上は見つけた。まだあるかもしれない。

番号	英単語	サイト上の和訳（一部抜粋の場合あり）	誤字訂正内容
9034	enjoyable	楽しろい,愉快な,楽しめる	楽しろい→楽しい
9072	lunar	年の,年に関連する	年→月
9096	bruise	打に傷(あざ)をつける;……（中略）打ち傷がつく	打に傷→打ち傷
9097	left-hand	《名詩の前にのみ用いて》	名詩→名詞
9129	spar	(ボクシングの練習のために)ハパーリングをする	ハパーリング→スパーリング
9217	ballast	(気救の)砂袋	気救→気球
9311	confusing	乱混させる[ような],当惑させる	乱混→混乱
9341	saffron	サフラン/サフラン自の	自→色
9347	homesick	ホームショクの	ョ→ッ
9365	artery	(道路・水路・鉄道などの)勘線	勘線→幹線
9367	bribery	贈賄(ぞうわい);周賄	周賄→収賄
9370	terrify	おびやすか	おびやすか→おびやかす
9384	talker	話し手 / おじゃべりな人	おじゃべり→おしゃべり
9387	insertion	挿入物;(新物の)折り込み広告	新物→新聞
9404	debauchery	《通例複数形で》らんちぎ騒ぎ	らんちぎ→らんちき（乱痴気）
9411	stuffing	(枕なとの中に入れる)詰め物	と→ど
9440	enhance	…‘の’程度(仮値など)を高める	仮値→価値
9473	masquerade	仮面舞踏班に出る	班→会?
9495	impiety	不信心,分敬,分孝	分→不
9643	mettle	気性,気質 / 件気,勇気	件気→血気
9681	collateral	担保,低当,見返り物資	低当→抵当
9714	scamp	ならず者 / いたずら者,わんぱく小訴	小訴→小僧
9724	magnify	〈レンズなどが〉…‘を’『拡大うる』	う→す
9803	billiards	玉突き,撞救,ビリヤード	撞救→撞球
9825	baleful	有割な;悪意のある	有割→有害
9833	perversion	墜落,邪道,変熊	墜落→堕落、熊→態
9839	usury	高利貸し業 / (法外な・違な)高利	違→違法
9857	baffle	〈人〉’を’除方に暮れさせる	除方→途方
9884	cobbler	鞍直し職人コブラー(フルーツパイの一種)	鞍→靴
9880	notch	〈競技の得殿など〉’を’記録する	得殿→得点
9892	insoluble	浴解しない	浴→溶
9906	shred	(特に細長い)切れ端;断語	断語→断片?
9941	lurk	『潜む』,潜状する	潜状→潜伏
9955	gable	破風(はふ),切り妻(屋根の斜目を2辺とした三角形の外壁部)	斜目→斜面?
9994	unmindful	(…を)気にかけない,(…に)むとなじゃくな	むとなじゃく→むとんじゃく
10000	pewter	白目(しろめ)(すずめを主成分とした合金;昔,台所用品に用いた)	すずめ→すず（錫）
9692	infusion	振り出し汁	???

mettleの「件気」は「元気」の誤りに見えなくもないが、英辞郎を引いたら「血気」という訳語が出たのでこれの誤字と解釈した。

何でこんなに誤字脱字が多いのか気になりすぎたので、パターンを分類してみた。（ここの矢印は、上の表とは逆で正しい字→誤字の順。）

「字形が似た漢字（読みは異なる）」に化けた。精度の悪いOCRを適用した際の誤りだろうか。
- 溶解→浴解、不孝→分孝
「読みが同じ漢字（字形は異なる）」に化けた
- 幹線→勘線
- 断片→断語も最初意味不明だったが、「かた」という読み仮名を持つので、読みが同じ漢字どうしと思われる。
「読みが似た漢字」に化けた
- 血気→件気、斜面→斜目
ひらがな関係
- 楽しい→楽しろい、枕など→枕なと、すず→すずめ
その他、もう何が何だか分からない
- 混乱→乱混、月の→年の、仮面舞踏会→仮面舞踏班

どういうプロセスでこの辞書は作られたんだろうか……??
ある辞書に対してOCRを適用したならば「読みが同じ漢字（字形は異なる）」に変化することはないだろう。逆にパソコンに手で打ち込んでいったならば、「字形が似た漢字（読みは異なる）」がありえないと思うのだが。全くもって謎である。

誤字脱字が大量にあるが、その中で一番ヤバいのは lunar 「年の」である。俺はこの単語帳をやる前の時点で「lunar = 月の」だと知っていたので、間違いに気づいたが、何も知らない人がこの単語帳で勉強したら、「lunar = 年の」だと信じてそれで覚える可能性が高い。

2番目に同様にヤバいのは「cobbler」である。 lunarとは違って、俺はこっちの単語を知らなかった。ただ「鞍直し職人」という（実は間違っている）訳語を見た俺が、「いや鞍直し職人ってなんだよ。馬の鞍を直すの専門なのかよ」と思って各種辞書を調べたら、こう出てきた。

cobbler 【名】靴屋、靴修理屋英辞郎

A cobbler is a person whose job is to make or mend shoes. COBBLER definition and meaning | Collins English Dictionary

おい！鞍じゃなくて、靴じゃないか！危うく「lunar」と同じように間違ったほうで覚えるところだった。

訳語が妙に多い

番号	英単語	サイト上の和訳全文
9264	tilt	…‘を’傾ける / (馬上槍試合で)〈槍〉‘を’突き出す,〈相手〉‘を’槍で突く / 傾く / 馬上槍試合をする / (相手を)槍で突く《+at+名》 / (文章・言葉で)(…を)攻撃する《+at+名》 / 傾き,傾斜(slope) / (中世騎士の)馬上槍試合 / (一般に)対決,試合
9622	graze	〈家畜が〉『牧草を食う』,草を食う / 〈家畜が〉(草などを)食(は)む《+『on』+『名』》 / 〈家畜〉‘に’『牧草を食べさせる』;〈家畜〉‘を’放牧する / 〈草原〉‘を’牧場に使う / 〈家畜が〉〈生草〉‘を’食う …‘を’かする / …‘の’皮膚をすりむく / (…を)かすめて通る《+『along』『by』,『past』)+『名』》 / (…で)こすってすりむく《+『against』+『名』》 / 〈U〉〈C〉かすめて通ること / 〈C〉すりむいた傷

tiltは「英検1級単熟語EX」にも載っているが、その訳語は「動（人・ものが）傾く；（もの）を傾ける / 名傾く［傾ける］こと」である。当然ながら馬上槍試合のことは書いていなかった。 grazeは大きく2つの意味があるから長くなりがちだが、それにしても同じような訳語が何度も書いてある。

訳語が妙にマニアック

番号	英単語	サイト上の和訳全文
9451	lettuce	レタス,チシャ
9998	bale	(輸送または貯蔵用に包装した))…の)大包み,こり,俵《+『of』+『名』》 / …’を’こりにする,俵に入れる =bail

チシャってなんだ!?と思ったらレタスの和名（萵苣）らしい。それは「レタス」だけ書いておけば良いんだよ。全員それでわかるから。
「こり」を知らなかったのでまた誤字かと思ったが、「梱」と書いて「こり」と読むらしい。英和辞典を引いてもだいたいこの訳語なので、これで合っているのだろうが……わかりにくいね。

訳語が妙に少ない

番号	英単語	サイト上の和訳全文
9795	exuberance	豊富,充満;繁茂
9828	glue	『にかわ』,にかわ剤;(一般に)接着剤 / …‘を’にかわで付ける / 《しばしば受動態で》(…に)…‘を’くっ付けて離さない(離れない),〈視線など〉‘を’くぎ付けにする《+『名』+『to』(『on』)+『名』》
9876	ingredient	(混合物の)成分,原料 / 構成要素

exuberanceは英辞郎を引いたら「元気いっぱいなこと、活力にあふれていること」と出た。一番良く見かけるのはこれじゃないか?
glueの一番一般的な訳語は「のり」だと思う。
ingredientの一般的な訳語は「料理の材料」だと思う。

探せばもっとある気がするが、もう書ききれないのでこの辺で終わりにしよう。

発音が間違っている

「英単語の選び方がおかしい」「英単語の和訳がおかしい」の2つだけと言ったな、あれは嘘だ。発音の誤りも見つけてしまった。

番号	英単語	サイト上の発音記号
9881	ruse	rú:sei

総評：ただより高いものはない。単語帳の本を買いましょう。

2024年の4月からは英検1級のEXをつかって単語を覚えているが、さすがに単語の選び方・訳語ともしっかりしていて、いちいち疑わずに安心して覚えられる。タダにつられて適当な単語帳を使うと、いちいち調べ直して時間を無駄にしたり、「lunar = 年の」と間違って覚えることになったりするので、ちゃんとお金を出して単語帳を買ったほうがよいということを身をもって思い知った。

出る順で最短合格!英検1級単熟語EX 第2版 (単熟語EXシリーズ)

ジャパンタイムズ出版

Amazon

この妙な誤字はどこから来たのか（どの辞書を使っているのか）

さて、一体この妙な和訳の元ネタは何なんだろうか?

この「最後の英単語」とは無関係に、Amazonでなりしか「極限の英単語」のレビューを見ていたら、驚くべき指摘を見つけた。

cobblerが「鞍直し職人」となっているが鞍じゃなく靴ではなかろうか
https://www.amazon.co.jp/gp/customer-reviews/R28DXE7VDZTVXF/ref=cm_cr_dp_d_rvw_ttl?ie=UTF8&ASIN=B074MD9QCB

なに〜〜〜!? cobblerを「鞍直し職人」と間違って書いてあるのは、この「最後の英単語」となりしか「極限の英単語」で共通しているのか!? となると、両者に共通する元ネタとなる辞書があるはずだ。

「cobbler "鞍直し職人"」で検索すると、4件ヒットする。2件は「最後の英単語」と「Amazonのレビュー」だから、残りは2つだ。

http://eigoyasan.blog.fc2.com/blog-entry-2553.html からたどっていくと、

辞書データはネット上に公開されているejdicの修正版を使わせていただきました（出所：無料英和辞書データダウンロード＠WEB便利ツール by クジラ飛行机様）。

と書いてある。

いまはEnglish-Japanese Dictionary "ejdict-hand" というGitHubリポジトリになっている。
（件数が多すぎるので）いままで述べてきた誤りを全部確認したわけではないが、

単純な誤字については殆ど直っている。（昔に「最後の英単語」の方には反映されていないので、俺が作ったAnkiカードには大量の誤字が入っている）
ただし、訳語を見て誤字と分からないものは直っていない。
lunarは「年の」だしlunar eclipseは「年食」だ。
cobblerも間違った訳語「鞍直し職人」だ。

元となったデータは「ejdic」もしくは「ejdict」という名前らしい。
PrepTutorEJEICについてを見ると、古くからあり起源は不明らしい。
GitHubのデータは誤字が修正され、だいぶ良くなっているが、上記のような誤りが混入していることには注意した方が良い。

それでは。

2024-03-18

英検準1級に合格した

英語

英検準1級に合格した

2023年第3回試験
1月21日（日）1次試験
3月3日（日）2次試験
3月12日〜合否発表（ネット上）
というわけで確認したら受かってました。

結果
1次試験
2次試験
これからどうする?

結果

特にリーディングは700/750って書いてあるから、CEFRのC1レベルに届いているな。（準1級だとC1達成と判定しないので、結果ページのCEFRではB2ってことになっているが……）

B2の下限が英検CSEスコア2300、C1の下限が2600。俺の現在スコアが2487（下限+187点）。
ということはB2の中でも下から6割くらいのところか。

1次試験

筆記試験90分の時間配分をメモっていたのでここに書いておきます。最初の問題から順に解いています。

語彙：14分
大問2（設問31まで）：8分（合計22分）
大問3（設問41まで）：30分（合計52分）文章3つのそれぞれを解いたのが合計29分、40分、52分のとき。
英作文開始。YES/NOそれぞれの理由を書き出して、NOで行こうと書き始めたのが16分後（合計68分）
最初の書き出しにだいぶ悩んで、最後に書き終わったのは終了の2分前くらいだった。

ただリーディング大得意で読むの速い人の記録なので、もう少し長くかかると思います。これから受ける人は英作文を早めに書き上げられると良いでしょう。

2次試験

さて2次試験について書いていくが……

英検の公式ホームページにも2次試験の過去問は掲載されていない。
第一に質問文を著作権の関係でも問題があるし、第二に正確な質問文は覚えていない。日本語でだいたいの意味を書いています。
（ただ2024年度から試験形式が変わるから、あまり参考にはならないかも?）

着席して軽く話をする。自己紹介は「35歳です、ITエンジニアとしてITコンサルティング会社で働いています」と喋った。
2問目で「休日は何をしていますか」と聞かれることに備えて、どう答えようか事前にあれこれ考えていたが、1問目だけで本題の試験に入った。

4コママンガは高層マンションの話。（詳しくは過去問題集を見てください。）

これを2分で説明する。 2コマ目では営業マンが「I can take you to the construction site.」的なセリフを喋っていた。これを間接話法で話さなければいけないので、とっさには難しい。「He told them that he can ... he could take them to the construction site.」と一度言い直した。

4コマ目は citizens are against the construction とか言った気がする。反対するなら「be opposed to the construction」とか使えば良かったな。

ここから質疑応答が4問入る。1問目はお決まりの「4コマ目の登場人物の心情を答えよ」である。
……さて、後から振り返ると、これは英検準1級の過去の傾向、典型から外れた、結構イレギュラーな4コママンガである。
YouTubeの解説動画を見ると、1コマ目で何か課題が発生します的なことを言っていたと思うけど、今回の1コマ目では明らかに問題は発生していない。
4コマ目で問題が起きたといえば起きたが、そんなに重大な問題でもない。別に家を購入したわけじゃないんだから、

というわけで試験当時に戻ると、俺は困ってしまった。
「反対運動なんか知らない、俺は絶対にここに住むんだ」という極端な賛成も「反対運動が起きているから、ここに住むのは絶対に無理だ、諦めよう」という極端な反対も極端な反対も取りにくいな、と思った。
「ここに住むのは良いと思うが、住民の反対が強いので住むのが難しいのではないか……」的などっちつかずなことを言った。

第2問。インターネット上のコンテンツは人々がものを買うことに影響しているか、じゃなかったっけ?
これはYESが答えやすいでしょう。

インターネット上には多くの広告がある
人々は多くの広告を普段目にしているので、ものを買う上でそれらを参考にする
また口コミサイトも多くあるので、これもものを買う上で他の人の意見を参考にする

的なことを言おうとしたが、「参考にしている」が全然出てこなくてだいぶ詰まった。

第3問。最近の若者が政治に関わっているかだね、確か。

なぜか咄嗟にグレタ・トゥーンベリが思い浮かんだので、YESで。

今日は世界的な課題が多くある、例えば大気汚染や難民など。
これらの課題を解決するためには政治的な取り組みが必要である。
若者はこれらの課題を解決すべきだと訴えている。また政治家にもアピールしている。

LOGOPHILIAの単語帳で見た「take to the streets」（街頭デモを行う）を使おうとしたが、間違って「take out to the streets」って言った気がする。

第4問。都会に農業地帯を増やすべきか、だったと思う。

agricultural という単語が聞こえたので農地のことだとは思ったが、咄嗟に論説が組み立てられなくて、ただの緑地として答えてしまった。
都会の人間はストレスが溜まってるから緑を見てリラックスできるので、緑地……and agricultural areaを増やすべきだ、と最後で強引に軌道修正した。

これからどうする?

次は英検1級……だがそのハードルは結構高そう。

リーディング
- の中の単語（語彙）。これはもう単語帳を頑張れということしかない。
  - 「でた単」のアプリやる? いやでもあのアプリ、準1級を少し使ったけど、単語の日本語の意味の書き方に引っかかることが多かったんだよな……
  - パス単は単語レベルが簡単になってしまった的な話を聞くので、ジャパンタイムズ社の問題集か、EXか、キクタンか……あれ結構種類があるな。
  - 過去記事で書いた通り、私は英単語をフレーズで覚えるのが大好きなので、これの1級のバージョンが出ないか期待している。
- それ以外の読解力については心配してないです。英語を読むのは早い自信があるし、内容の把握もほぼ間違えないだろう。
リスニング
- TOEICでやってたから余裕だろと思ったら今回ボコボコにされた。
- 一発で聞き取って内容を把握する
ライティング
- 要対策だと思うけど
スピーキング
- 一番苦手……
- やはりこれは日常生活の中で英語を喋る機会がないと言うことに尽きる。なので機会を作らなければならない。
- 準1級の前はDMM英会話をやったけど、少しやったら飽きてしまった。

英検1級に本当に受かりたかったら全体的に底上げが必要だと思うけど、なんとなく単語帳だけやってしまって試験の日を迎えるような気がしてならない。

出る順で最短合格!英検1級単熟語EX 第2版 (出る順で最短合格シリーズ)

ジャパンタイムズ出版

Amazon

ちなみに準1級の過去問は↓を使っていました。

英検準1級過去問題集 (2024年度)

作者:Gakken
Gakken

Amazon

それでは。

追伸英検1級の合格はこちら。ちょうど1年後でした

linus-mk.hatenablog.com

今までの英語学習まとめはこちら。 linus-mk.hatenablog.com

概要

はじめに 文字起こしをAIで上手く整形したい

実験の設定

サンプル用の入力文

モデル

要約するためのプロンプトを考える（作ってもらう）

結果 プロンプトと出力結果

レベル1

レベル2

レベル3

レベル4

レベル5

考察

余談：この作業にObsidianは本当に必要か?

試験開始まで

入室〜フリートーク

スピーチ準備

スピーチ

質疑

反省（帰宅しながら色々思ったこと）

トピックをどう解釈すべきか?

スピーチについて

結果発表！

感想

関連記事

どんな論文?

先行研究と比べてどこがすごい?

技術や手法の肝はどこ？

2) Page Retrieval （ページ検索）

3) Question Answering （質問応答）

議論はある?

Figure 6 をよく調べる

おまけ：

「最後の英単語」を使って単語を覚えた状況について

英単語の選び方がおかしい

全体的なレベル感

固有名詞が少なからずある

異常に簡単な単語がある

異常に難しい単語がある

和訳がおかしい

誤字が非常に多い

訳語が妙に多い

訳語が妙にマニアック

訳語が妙に少ない

発音が間違っている

総評：ただより高いものはない。単語帳の本を買いましょう。

この妙な誤字はどこから来たのか（どの辞書を使っているのか）

結果

1次試験

2次試験

これからどうする?

はじめに文字起こしをAIで上手く整形したい

結果プロンプトと出力結果