arXiv 入門 - cs.AI の最新論文を追う方法と、非常勤講師としての使い方

arXiv 入門 - cs.AI の最新論文を追う方法と、非常勤講師としての使い方

作成日:
読了:10
更新日:

AI や CS の最新研究を追うなら、arXiv は外せません。新しいモデルや手法は論文として arXiv に出てから製品化されることが多く、ここを見ておくと「次に来るもの」が早く分かります。この記事では、arXiv の基本と cs.AI の追い方を整理し、後半では筆者が大学の非常勤講師としてどう使っているかも紹介します。

arXiv とは

  • プレプリント(査読前論文)のオープンアクセス基盤。著者は査読を待たずに研究を公開できる
  • 1991年に Paul Ginsparg が創設。現在は Cornell Tech(コーネル大学)が運営(Simons財団等が支援)
  • 収録は 8分野(cs / math / physics / q-bio / q-fin / stat / eess / econ)、累計約300万件規模
  • 重要: arXiv 自体は査読をしない。不適切な投稿を弾くモデレーションはあるが、公式に「査読プロセスではない」と明言されている

WARNING

arXiv 掲載は「学会・学術誌の査読に通った」ことを意味しません。内容の正確性は著者の責任で、玉石混交です。鵜呑みにせず、後述の読み方・注意点を押さえてください。

cs.AI と recent 一覧

  • cs(コンピュータサイエンス)には40ほどのサブカテゴリがあり、cs.AI(Artificial Intelligence)はその一つ
  • 注意点: 世間でいう「AI」の主役(深層学習・LLM)は、実は cs.LG(機械学習)・cs.CL(自然言語処理)・cs.CV(画像)に多く投稿されます。cs.AI だけ見ても全貌は掴めません
  • /list/cs.AI/recent該当ページ)は直近に投稿・更新された論文の一覧。各エントリに arXiv ID・タイトル・著者・PDF/HTML リンクが並ぶ
  • cross-list: 主カテゴリが cs.LG 等でも、著者が関連指定すると cs.AI の一覧にも現れます。cross-list 込みで追うのがコツ

arXiv ID・バージョン・ライセンス

  • ID: 2007年4月以降は YYMM.NNNNN 形式(例 2506.01234
  • バージョン: 改訂のたびに v1 v2 …。2506.01234 は最新版、2506.01234v1 は初稿を指す。引用時はバージョンを意識
  • ライセンス: 著者が投稿時に選択(CC BY / CC BY-NC-ND / arXiv の非独占ライセンス / CC0 など)。論文ごとに再利用条件が違うので、転載・改変前に確認
  • 引用: arXiv:2506.01234 形式。査読済みの出版版(DOI付き)があればそちらを優先し、arXiv版を補記するのが学術慣例

最新を追う手段

毎回ページを開かなくても、新着を自動で受け取れます。

  • RSS: https://rss.arxiv.org/rss/cs.AI(複数は cs.AI+cs.LG のように + 連結)。毎日更新
  • メール通知: カテゴリ別に日次でアブストラクト一覧が届く
  • API: http://export.arxiv.org/api/query(Atom形式)。自前のフィルタやツールに組み込める
  • 公開スケジュール: 新着は日〜木の夜(米国東部時間 20:00 ET)に公開、金・土はなし。日本時間だと平日の昼ごろに増える感覚

周辺ツール

arXiv 単体より、これらと組み合わせると一気に快適になります。

ツール何が便利か
Hugging Face Papersコミュニティが推す話題の論文を毎日。モデル/データ連携も
alphaXiv論文上で行単位の議論・コメントができる
Papers with Code論文に実装コード・ベンチ結果を紐付け
Semantic Scholar引用解析+AI要約(Allen Institute 運営)
Connected Papers引用関係をグラフで可視化し関連研究を俯瞰
arXiv HTML(arxiv.org/html/...公式のHTML版。流し読み・スクリーンリーダー対応

注意点(プレプリントの読み方)

  • 査読なし=正確性は保証されない。撤回・大幅改訂もある(版を確認
  • AI生成の低品質論文の増加: LLM 支援による粗いサーベイの大量投稿が問題化し、2026年には arXiv がAI生成コンテンツの規制を強化したと報じられています(虚偽引用への投稿制限など)。引用の妥当性は自分で確かめる
  • cs.AI の範囲は狭い。cross-list や cs.LG/cs.CL も合わせて見る

非常勤講師としての普段の使い方

筆者は大学の非常勤講師もしており、arXiv は授業準備にも普段の学習にも欠かせません。実際の使い方を紹介します。

1. キャッチアップ(毎日の習慣)

  • cs.AI / cs.LG / cs.CL の recent を RSS で購読し、朝にタイトルとアブストだけ流し読み
  • 全部は読めないので、Hugging Face Papers で「今日話題のもの」を拾って優先度を付ける
  • 読むときは アブスト → 図・表 → 結論 → 必要なら本文の順。HTML版で素早く

2. 授業準備

  • 講義で扱うトピックは、教科書だけでなく arXiv で「原典」や最新事例を1〜2本確認してから話す
  • スライドには arXiv:ID で出典を明記。学生が自分で原文に当たれるようにする
  • 体系的な背景は Connected Papers で関連研究を俯瞰し、Papers with Code で実装の有無を確認

3. 学生への活用と「リテラシー教育」

  • 学生に1本選んで要約・発表させる課題は、最新動向に触れさせるのに有効
  • 同時に必ず伝えるのが 「プレプリント=査読前」という前提査読版を優先すること、版(v1/v2)や cross-listの見方、AI生成論文・虚偽引用に注意することをセットで教える
  • 読んだ論文は Markdown でメモに残して再利用(Obsidian+Dropboxの運用

NOTE

「最新を全部追う」のは不可能です。RSSで広く浅く拾い、話題のものだけ深く読む、そしてメモに残す——この3点に絞ると、講義の合間でも無理なく続けられます。

まとめ

  • arXiv は査読前論文のオープンアクセス基盤(1991年〜、Cornell Tech 運営、約300万件)。査読はされていない点が大前提
  • cs.AI だけでなく cs.LG/cs.CL と cross-listも合わせて追う。/list/cs.AI/recent が新着一覧
  • 追跡は RSS / メール / API。読みやすさは HTML版+周辺ツール(HF Papers / Connected Papers / Papers with Code)
  • 引用は arXiv:ID+査読版優先版・ライセンス・AI生成論文に注意
  • 講師としては RSSでキャッチアップ → 授業の出典に → 学生の課題+リテラシー教育、が実用的

「論文は遠い世界のもの」と構えず、recent をRSSで流し読みするところから始めると、AI の変化の速さに振り落とされにくくなります。

参考リンク

Bun のコアが Zig から Rust へ - Claude が6日で約100万行を書き換えた話(安定版はまだZig)

Bun のコアが Zig から Rust へ - Claude が6日で約100万行を書き換えた話(安定版はまだZig)

8

JavaScript ランタイム Bun が、コアを Zig から Rust へ書き換える巨大 PR(#30412、約100万行追加・6,755コミット)を2026年5月14日に main へマージしました。Anthropic の Claude Code(dynamic workflows)でほぼ全自動生成され、人手なら約1年の作業が約6日で完了したとされます。ただし安定版は今もZig実装で、Rust版は canary 提供。書き換えの理由(Zigのno-AIポリシー・Rustのコミュニティ・メモリ安全性)、unsafeブロック1.3万個などの論争点、AI駆動開発の意味までを一次ソースで整理します。

Gemini 3.5 Flash - 高速・低価格でコーディングとエージェントを強化(Pro はプレビュー)

Gemini 3.5 Flash - 高速・低価格でコーディングとエージェントを強化(Pro はプレビュー)

7

Google が2026年5月19日の I/O で一般提供を開始した Gemini 3.5 Flash を、公式情報を一次ソースに整理します。1Mトークンのコンテキスト、4段階の thinking、入力 $1.50 / 出力 $9.00 という価格、Terminal-Bench 2.1 や MCP Atlas などコーディング・エージェント系での向上、そして「3.1 Flash の3倍の価格」という注意点まで。あわせて、まだ GA していない Gemini 3.5 Pro(2Mコンテキスト・Deep Think、プレビュー段階)の現状も正確に区別して解説します。

GLM-5.2 - GPT-5.5を一部上回るMITオープンウェイトのコーディングモデル(1Mコンテキスト)

GLM-5.2 - GPT-5.5を一部上回るMITオープンウェイトのコーディングモデル(1Mコンテキスト)

7

Zhipu AI(Z.ai)が2026年6月13日に公開した GLM-5.2 は、ウェイトを MIT ライセンスで配布する 744B 規模(アクティブ約40B)の MoE コーディングモデルです。1M トークンのコンテキスト、SWE-bench Pro 62.1 でオープンウェイトとして初めて GPT-5.5 を上回ったとされる評価、GPT-5.5 比でおよそ1/6という API 価格、ローカル実行(量子化)まで、Z.ai 公式・Hugging Face を一次ソースに、誇張せず注意点込みで整理します。