
arXiv 入門 - cs.AI の最新論文を追う方法と、非常勤講師としての使い方
AI や CS の最新研究を追うなら、arXiv は外せません。新しいモデルや手法は論文として arXiv に出てから製品化されることが多く、ここを見ておくと「次に来るもの」が早く分かります。この記事では、arXiv の基本と cs.AI の追い方を整理し、後半では筆者が大学の非常勤講師としてどう使っているかも紹介します。
arXiv とは
- プレプリント(査読前論文)のオープンアクセス基盤。著者は査読を待たずに研究を公開できる
- 1991年に Paul Ginsparg が創設。現在は Cornell Tech(コーネル大学)が運営(Simons財団等が支援)
- 収録は 8分野(cs / math / physics / q-bio / q-fin / stat / eess / econ)、累計約300万件規模
- 重要: arXiv 自体は査読をしない。不適切な投稿を弾くモデレーションはあるが、公式に「査読プロセスではない」と明言されている
WARNING
arXiv 掲載は「学会・学術誌の査読に通った」ことを意味しません。内容の正確性は著者の責任で、玉石混交です。鵜呑みにせず、後述の読み方・注意点を押さえてください。
cs.AI と recent 一覧
cs(コンピュータサイエンス)には40ほどのサブカテゴリがあり、cs.AI(Artificial Intelligence)はその一つ- 注意点: 世間でいう「AI」の主役(深層学習・LLM)は、実は
cs.LG(機械学習)・cs.CL(自然言語処理)・cs.CV(画像)に多く投稿されます。cs.AIだけ見ても全貌は掴めません /list/cs.AI/recent(該当ページ)は直近に投稿・更新された論文の一覧。各エントリに arXiv ID・タイトル・著者・PDF/HTML リンクが並ぶ- cross-list: 主カテゴリが
cs.LG等でも、著者が関連指定するとcs.AIの一覧にも現れます。cross-list 込みで追うのがコツ
arXiv ID・バージョン・ライセンス
- ID: 2007年4月以降は
YYMM.NNNNN形式(例2506.01234) - バージョン: 改訂のたびに
v1v2…。2506.01234は最新版、2506.01234v1は初稿を指す。引用時はバージョンを意識 - ライセンス: 著者が投稿時に選択(CC BY / CC BY-NC-ND / arXiv の非独占ライセンス / CC0 など)。論文ごとに再利用条件が違うので、転載・改変前に確認
- 引用:
arXiv:2506.01234形式。査読済みの出版版(DOI付き)があればそちらを優先し、arXiv版を補記するのが学術慣例
最新を追う手段
毎回ページを開かなくても、新着を自動で受け取れます。
- RSS:
https://rss.arxiv.org/rss/cs.AI(複数はcs.AI+cs.LGのように+連結)。毎日更新 - メール通知: カテゴリ別に日次でアブストラクト一覧が届く
- API:
http://export.arxiv.org/api/query(Atom形式)。自前のフィルタやツールに組み込める - 公開スケジュール: 新着は日〜木の夜(米国東部時間 20:00 ET)に公開、金・土はなし。日本時間だと平日の昼ごろに増える感覚
周辺ツール
arXiv 単体より、これらと組み合わせると一気に快適になります。
| ツール | 何が便利か |
|---|---|
| Hugging Face Papers | コミュニティが推す話題の論文を毎日。モデル/データ連携も |
| alphaXiv | 論文上で行単位の議論・コメントができる |
| Papers with Code | 論文に実装コード・ベンチ結果を紐付け |
| Semantic Scholar | 引用解析+AI要約(Allen Institute 運営) |
| Connected Papers | 引用関係をグラフで可視化し関連研究を俯瞰 |
arXiv HTML(arxiv.org/html/...) | 公式のHTML版。流し読み・スクリーンリーダー対応 |
注意点(プレプリントの読み方)
- 査読なし=正確性は保証されない。撤回・大幅改訂もある(版を確認)
- AI生成の低品質論文の増加: LLM 支援による粗いサーベイの大量投稿が問題化し、2026年には arXiv がAI生成コンテンツの規制を強化したと報じられています(虚偽引用への投稿制限など)。引用の妥当性は自分で確かめる
- cs.AI の範囲は狭い。cross-list や
cs.LG/cs.CLも合わせて見る
非常勤講師としての普段の使い方
筆者は大学の非常勤講師もしており、arXiv は授業準備にも普段の学習にも欠かせません。実際の使い方を紹介します。
1. キャッチアップ(毎日の習慣)
cs.AI/cs.LG/cs.CLの recent を RSS で購読し、朝にタイトルとアブストだけ流し読み- 全部は読めないので、Hugging Face Papers で「今日話題のもの」を拾って優先度を付ける
- 読むときは アブスト → 図・表 → 結論 → 必要なら本文の順。HTML版で素早く
2. 授業準備
- 講義で扱うトピックは、教科書だけでなく arXiv で「原典」や最新事例を1〜2本確認してから話す
- スライドには
arXiv:IDで出典を明記。学生が自分で原文に当たれるようにする - 体系的な背景は Connected Papers で関連研究を俯瞰し、Papers with Code で実装の有無を確認
3. 学生への活用と「リテラシー教育」
- 学生に1本選んで要約・発表させる課題は、最新動向に触れさせるのに有効
- 同時に必ず伝えるのが 「プレプリント=査読前」という前提。査読版を優先すること、版(v1/v2)や cross-listの見方、AI生成論文・虚偽引用に注意することをセットで教える
- 読んだ論文は Markdown でメモに残して再利用(Obsidian+Dropboxの運用)
NOTE
「最新を全部追う」のは不可能です。RSSで広く浅く拾い、話題のものだけ深く読む、そしてメモに残す——この3点に絞ると、講義の合間でも無理なく続けられます。
まとめ
- arXiv は査読前論文のオープンアクセス基盤(1991年〜、Cornell Tech 運営、約300万件)。査読はされていない点が大前提
cs.AIだけでなくcs.LG/cs.CLと cross-listも合わせて追う。/list/cs.AI/recentが新着一覧- 追跡は RSS / メール / API。読みやすさは HTML版+周辺ツール(HF Papers / Connected Papers / Papers with Code)
- 引用は
arXiv:ID+査読版優先。版・ライセンス・AI生成論文に注意 - 講師としては RSSでキャッチアップ → 授業の出典に → 学生の課題+リテラシー教育、が実用的
「論文は遠い世界のもの」と構えず、recent をRSSで流し読みするところから始めると、AI の変化の速さに振り落とされにくくなります。


