arXiv 入門 - cs.AI の最新論文を追う方法と、非常勤講師としての使い方

AI や CS の最新研究を追うなら、arXiv は外せません。新しいモデルや手法は論文として arXiv に出てから製品化されることが多く、ここを見ておくと「次に来るもの」が早く分かります。この記事では、arXiv の基本と cs.AI の追い方を整理し、後半では筆者が大学の非常勤講師としてどう使っているかも紹介します。

arXiv とは

プレプリント（査読前論文）のオープンアクセス基盤。著者は査読を待たずに研究を公開できる
1991年に Paul Ginsparg が創設。現在は Cornell Tech（コーネル大学）が運営（Simons財団等が支援）
収録は 8分野（cs / math / physics / q-bio / q-fin / stat / eess / econ）、累計約300万件規模
重要: arXiv 自体は査読をしない。不適切な投稿を弾くモデレーションはあるが、公式に「査読プロセスではない」と明言されている

WARNING

arXiv 掲載は「学会・学術誌の査読に通った」ことを意味しません。内容の正確性は著者の責任で、玉石混交です。鵜呑みにせず、後述の読み方・注意点を押さえてください。

cs.AI と recent 一覧

cs（コンピュータサイエンス）には40ほどのサブカテゴリがあり、cs.AI（Artificial Intelligence）はその一つ
注意点: 世間でいう「AI」の主役（深層学習・LLM）は、実は cs.LG（機械学習）・cs.CL（自然言語処理）・cs.CV（画像）に多く投稿されます。cs.AI だけ見ても全貌は掴めません
/list/cs.AI/recent（該当ページ）は直近に投稿・更新された論文の一覧。各エントリに arXiv ID・タイトル・著者・PDF/HTML リンクが並ぶ
cross-list: 主カテゴリが cs.LG 等でも、著者が関連指定すると cs.AI の一覧にも現れます。cross-list 込みで追うのがコツ

arXiv ID・バージョン・ライセンス

ID: 2007年4月以降は YYMM.NNNNN 形式（例 2506.01234）
バージョン: 改訂のたびに v1 v2 …。2506.01234 は最新版、2506.01234v1 は初稿を指す。引用時はバージョンを意識
ライセンス: 著者が投稿時に選択（CC BY / CC BY-NC-ND / arXiv の非独占ライセンス / CC0 など）。論文ごとに再利用条件が違うので、転載・改変前に確認
引用: arXiv:2506.01234 形式。査読済みの出版版（DOI付き）があればそちらを優先し、arXiv版を補記するのが学術慣例

周辺ツール

arXiv 単体より、これらと組み合わせると一気に快適になります。

ツール	何が便利か
Hugging Face Papers	コミュニティが推す話題の論文を毎日。モデル/データ連携も
alphaXiv	論文上で行単位の議論・コメントができる
Papers with Code	論文に実装コード・ベンチ結果を紐付け
Semantic Scholar	引用解析＋AI要約（Allen Institute 運営）
Connected Papers	引用関係をグラフで可視化し関連研究を俯瞰
arXiv HTML（`arxiv.org/html/...`）	公式のHTML版。流し読み・スクリーンリーダー対応

注意点（プレプリントの読み方）

査読なし＝正確性は保証されない。撤回・大幅改訂もある（版を確認）
AI生成の低品質論文の増加: LLM 支援による粗いサーベイの大量投稿が問題化し、2026年には arXiv がAI生成コンテンツの規制を強化したと報じられています（虚偽引用への投稿制限など）。引用の妥当性は自分で確かめる
cs.AI の範囲は狭い。cross-list や cs.LG/cs.CL も合わせて見る

非常勤講師としての普段の使い方

筆者は大学の非常勤講師もしており、arXiv は授業準備にも普段の学習にも欠かせません。実際の使い方を紹介します。

1. キャッチアップ（毎日の習慣）

cs.AI / cs.LG / cs.CL の recent を RSS で購読し、朝にタイトルとアブストだけ流し読み
全部は読めないので、Hugging Face Papers で「今日話題のもの」を拾って優先度を付ける
読むときは アブスト → 図・表 → 結論 → 必要なら本文の順。HTML版で素早く

2. 授業準備

講義で扱うトピックは、教科書だけでなく arXiv で「原典」や最新事例を1〜2本確認してから話す
スライドには arXiv:ID で出典を明記。学生が自分で原文に当たれるようにする
体系的な背景は Connected Papers で関連研究を俯瞰し、Papers with Code で実装の有無を確認

3. 学生への活用と「リテラシー教育」

学生に1本選んで要約・発表させる課題は、最新動向に触れさせるのに有効
同時に必ず伝えるのが 「プレプリント＝査読前」という前提。査読版を優先すること、版（v1/v2）や cross-listの見方、AI生成論文・虚偽引用に注意することをセットで教える
読んだ論文は Markdown でメモに残して再利用（Obsidian＋Dropboxの運用）

NOTE

「最新を全部追う」のは不可能です。RSSで広く浅く拾い、話題のものだけ深く読む、そしてメモに残す——この3点に絞ると、講義の合間でも無理なく続けられます。

まとめ

arXiv は査読前論文のオープンアクセス基盤（1991年〜、Cornell Tech 運営、約300万件）。査読はされていない点が大前提
cs.AI だけでなく cs.LG/cs.CL と cross-listも合わせて追う。/list/cs.AI/recent が新着一覧
追跡は RSS / メール / API。読みやすさは HTML版＋周辺ツール（HF Papers / Connected Papers / Papers with Code）
引用は arXiv:ID＋査読版優先。版・ライセンス・AI生成論文に注意
講師としては RSSでキャッチアップ → 授業の出典に → 学生の課題＋リテラシー教育、が実用的

「論文は遠い世界のもの」と構えず、recent をRSSで流し読みするところから始めると、AI の変化の速さに振り落とされにくくなります。