VibeVoice - 오픈소스 프론티어 음성 AI 모델
Microsoft가 공개한 오픈소스 음성 AI 모델 패밀리로, TTS(텍스트→음성)와 ASR(음성→텍스트)을 모두 포함 ASR은 Open AI Whisper와 비슷하지만 화자 분리(speaker diarization) 기능이 모델 자체에 내장 핵심 혁신은 7.5Hz 초저 프레임 레이트.
최신 글을 우선으로 보여주고, 페이지 번호로 오래된 글까지 이동할 수 있게 정리했습니다.
Microsoft가 공개한 오픈소스 음성 AI 모델 패밀리로, TTS(텍스트→음성)와 ASR(음성→텍스트)을 모두 포함 ASR은 Open AI Whisper와 비슷하지만 화자 분리(speaker diarization) 기능이 모델 자체에 내장 핵심 혁신은 7.5Hz 초저 프레임 레이트.
Windows용 TrafficMonitor 플러그인인 TrafficMonitor AI Usage Limits를 만들어 보았습니다. Claude와 Codex의 사용량 한도 상태를 Windows 작업표시줄에 표시하는 플러그인입니다. 표시 항목은 다음과 같습니다. Claude 5시간 / 7일
LAO는 아이디어와 개발 AI 사이에 놓는 “설계 사무소” 같은 macOS 앱입니다. Claude Code, Codex, Gemini CLI 같은 개발 AI를 쓰다 보면 아이디어를 바로 채팅으로 던지고 개발을 시작하게 됩니다. 처음에는 빠른 것 같지만, 실제로는 만들고 나서야 빠진 것들
React로 영상의 각 프레임을 정의하는 방식으로, GUI 편집기 없이 TypeScript 코드만으로 MP4를 렌더링 이제 AI 에이전트가 코드를 만들어주기 때문에 더 쉽게 고화질 영상을 만들어낼 수 있게 됨 에이전트 스킬 npx skills add remotion-dev/skill..
PostgreSQL용 백업·복구 도구로서 대규모 환경까지 확장되도록 설계됐지만, 이제 유지보수를 종료 함 bug fix, PR review, 이슈 대응, 신규 기능 개발이 모두 중단됐고, 불규칙하게 끌고 가기보다 명확히 멈추는 쪽을 택함 전체·differential·incremental
중국 당국이 관련 법규에 따라 외국인 투자 금지 결정을 내리며, Meta의 Manus 인수 철회를 요구함 중국에서 설립된 뒤 Singapore로 이전한 Manus는 범용 AI 에이전트를 개발하며, 시장 조사·코딩·데이터 분석 같은 복잡한 작업을 수행할 수 있음... 이 기사에서는 주요
Remotion과 비슷하게 HTML + CSS + GSAP만으로 영상을 제작하고 MP4로 렌더링 React나 독자적 DSL 없이 순수 HTML 파일이 곧 비디오 컴포지션이며, 빌드 단계 없이 index.html이 그대로 재생됨 Claude Code, Codex 등의 AI 코딩 에이전트가
2026년 6월 1일부터 모든 GitHub Copilot 요금제가 월별 GitHub AI Credits 기준으로 과금되며, 사용량은 모델별 공개 API 요율에 따라 입력 토큰, 출력 토큰, 캐시된 토큰 소비량으로 계산됨 Copilot은 에디터 안 보조 도구를 넘어 agentic plat
TL;DR 리뷰를 집중적으로 해야 하는 하네스 — 코드 리뷰, 문서 리뷰, UX 리서치, 인터뷰 시뮬레이션 — 에서는 5명의 리뷰어가 5개의 다른 관점을 가져야 가치가 있다. 일반 AI 에이전트 팀은 5명이 모두 비슷한 이 포크는 NVIDIA Nemotron-Pers 이 기사에서는 주요