AI/Tech 다이제스트 — 2026-04-12
2026-04-12 AI/Tech 다이제스트
1. 최상위 AI 에이전트 벤치마크를 어떻게 깨뜨렸나
How We Broke Top AI Agent Benchmarks: And What Comes Next
hn · ⬆ 376 · 💬 94
Berkeley 연구진이 실제 작업을 풀지 않고도 상위 에이전트 벤치마크에서 거의 만점에 가까운 점수를 만드는 다양한 익스플로잇을 정리하며, 벤치마크 점수가 능력보다 채점 허점을 반영할 수 있음을 보였다.
💬 HN에서는 에이전트 벤치마크를 공격자 관점에서 다시 설계해야 한다는 반응과 함께, 이런 문제는 원래 평가가 신뢰에 크게 기대고 있었다는 사실의 재확인이라는 반론이 함께 나왔다.
2. 소형 모델도 Mythos가 찾은 취약점을 재현했다
Small models also found the vulnerabilities that Mythos found
hn · ⬆ 1103 · 💬 296
Anthropic의 Mythos 발표에 나온 취약점 사례를 분리해 소형 오픈웨이트 모델들로 다시 돌렸더니 8개 모델 모두 대표 FreeBSD 취약점을 포함한 분석을 상당 부분 재현했다고 주장한다.
💬 HN에서는 Mythos 결과가 생각보다 낮은 비용과 반복 실행으로도 재현 가능하다는 보강이 있었고, 동시에 원 발표가 재현 불가능한 주장에 너무 기대고 있었다는 비판도 나왔다.
3. OPD 해부, 길이 팽창과 대형 언어 모델 안정화 전략
Demystifying OPD: Length Inflation and Stabilization Strategies for Large Language Models
arxiv
온폴리시 증류(OPD)에서 rollout 길이가 갑자기 부풀고 잘린 trajectory가 학습 데이터를 지배하면서 반복과 검증 성능 붕괴가 일어나는 실패 모드를 분석하고, 이를 줄이는 안정화 전략을 제안한다.
4. 표현 스티어링은 왜 먹히는가, 거부 성향 스티어링의 메커니즘 사례 연구
What Drives Representation Steering? A Mechanistic Case Study on Steering Refusal
arxiv
거부(refusal) 스티어링을 대상으로 activation patching을 수행해 steering vector가 모델 내부의 어떤 회로를 건드리는지 추적했고, 서로 다른 방법이 같은 레이어에서 기능적으로 대체 가능한 회로를 활용한다는 해석을 제시한다.
5. PIArena, 프롬프트 인젝션 평가 플랫폼
PIArena: A Platform for Prompt Injection Evaluation
arxiv
프롬프트 인젝션 방어를 서로 다른 데이터셋, 공격 유형, 작업 조건에서 같은 기준으로 비교할 수 있는 통합 평가 플랫폼을 제안해 방어법의 실제 일반화 성능을 재보려 한다.
6. Postgres 큐를 건강하게 유지하는 법
Pretty sure Anthropic is A/B‑testing a price hike on Claude Max 5 and 20 right now. 100>150$ and 200>300$
reddit · ⬆ 118 · 💬 47
빠르게 churn되는 큐 테이블에서 장시간 트랜잭션이 vacuum을 막아 dead tuple이 쌓이고 성능이 무너지는 과정을 설명하며, MVCC horizon과 vacuum 관찰이 왜 필요한지 운영 관점에서 정리한다.
💬 HN에서는 이 문제가 새롭진 않다는 지적과 함께, 글의 MVCC horizon 설명 일부가 부정확하고 stock Postgres 도구만으로는 대응이 여전히 어렵다는 반론이 나왔다.
7. SQLite 3.53.0
rss
SQLite 3.53.0은 철회된 3.52.0 이후 변경을 합친 대형 릴리스로, ALTER TABLE에서 NOT NULL과 CHECK 제약 추가·제거를 지원하고 JSON 함수도 확장했다.
8. 월 20달러 기술 스택으로 1만 달러 MRR 회사 여러 개 운영하기
I run multiple $10K MRR companies on a $20/month tech stack
hn · ⬆ 183 · 💬 112
로컬 SQLite, 단순한 단일 서버, 최소한의 외부 서비스만으로 월 20달러 수준의 인프라 비용에 여러 SaaS를 운영하는 구성을 구체적으로 설명한다.
💬 HN에서는 SQLite가 원격 Postgres보다 훨씬 빠르다는 실무 감각에 공감하면서도, 핵심은 서버리스·쿠버네티스 과설계 없이도 작은 시스템으로 시작할 수 있다는 점이라는 반응이 많았다.
9. In-Context 메타러닝으로 학습 없이 피험자 간 뇌 신호 해독하기
Meta-learning In-Context Enables Training-Free Cross Subject Brain Decoding
arxiv
fMRI 기반 시각 의미 해독에서 피험자별 별도 fine-tuning 없이도 cross-subject generalization을 달성하려는 meta-optimized training-free 접근을 제안한다.
10. ChatGPT 음성 모드는 더 약한 모델이다
ChatGPT voice mode is a weaker model
rss
ChatGPT 음성 모드가 최신 텍스트 모델이 아니라 지식 cutoff가 2024년 4월인 구형 GPT-4o 계열 모델 위에서 동작한다는 점을 짚으며, 말로 대화한다고 해서 가장 강한 모델을 쓰는 것은 아니라는 사실을 설명한다.
11. Apple Silicon에서 2대 VM 제한 우회하기
Apple Silicon and Virtual Machines: Beating the 2 VM Limit (2023)
hn · ⬆ 202 · 💬 140
Apple Silicon의 macOS VM 2대 제한이 어디서 걸리는지 분석하고, 이를 우회해 더 많은 가상 머신을 띄우는 방법을 기술적으로 설명한다.
💬 HN에서는 이 제한이 기기 성능과 무관하게 일괄 적용되는 점이 이상하다는 반응과 함께, M3 이후 nested VM 지원이 사실상 우회 경로가 될 수 있다는 추가 정보가 나왔다.
12. 오픈 모델 컨소시엄이 결국 필요해지는 이유
The inevitable need for an open model consortium
rss
대형 오픈 모델 개발이 개별 연구실이나 스타트업이 감당하기 어려운 규모로 커지면서, 데이터·컴퓨트·평가를 공동으로 조직하는 컨소시엄 형태가 현실적인 대안이 될 수 있다는 주장을 펼친다.
Generated at 2026-04-12T09:59:01.292761+00:00Z