개발자 블로그

VORA 개발자 블로그

실제 개발 이야기: 무엇이 망가졌고, 무엇을 배웠으며, AI 회의 어시스턴트를 어떻게 만들었는지.

무료 AI

2026년 2월 기준 완전 무료 LLM 31종 완전 정복 가이드

OpenRouter, Groq, Google 등에서 사용 가능한 모든 무료 AI 모델 총정리 — 호출 제한, 컨텍스트 길이, 최적 사용 사례 비교. 신용카드 불필요.

Dev Log

실시간 음성인식에서 제미나이 429 에러를 정복한 방법

실시간 AI 음성 보정을 만들다가 제미나이 API를 거의 죽일 뻔했습니다. 429 에러를 완전히 제거하면서도 체감 지연 0초를 달성한 4단계 방어 아키텍처를 공개합니다.

Latest News

🚀 음성 인식계의 세대교체! 알리바바 Qwen3-ASR 패밀리 완전 정복

위스퍼(Whisper)의 아쉬움을 달래줄 '음성 인식계의 괴물' Qwen3-ASR이 등장했습니다. 0.6B의 가벼움부터 가창 인식, 감정 분석까지, 왜 이 모델이 게임 체인저인지 핵심만 짚어드립니다.

Latest News

🏎️ 2026 제미나이 속도 비교: 내게 맞는 AI "스포츠카"는?

2026년 2월, 어떤 제미나이 모델이 가장 빠르고 똑똑할까요? TPS와 TTFT 성적표부터 코딩 성능 반전까지, 내게 맞는 AI 모델을 선택하는 가이드를 제공합니다.

Latest News

"이게 된다고?" NVIDIA Canary Qwen, '생각'하는 AI의 등장

단순히 말을 글로 옮기는 단계를 넘어, 음성을 듣고 그 자리에서 요약하고 분석까지 해버리는 NVIDIA의 혁신적인 Canary Qwen 2.5B 모델을 소개합니다.

Latest News

[AI 트렌드] Google Gemini 3.0 출시 및 주요 업데이트 총정리 🚀🌟

구글이 야심 차게 공개한 Gemini 3.0 시리즈! 에이전틱 워크플로우와 고도화된 추론 능력을 통해 AI가 단순 챗봇을 넘어 '자율형 파트너'로 진화했습니다.

Tech Insights

SenseVoice Small: 경량 음성 인식 모델 심층 분석

VORA 팀은 알리바바의 경량 고성능 음성 인식 모델 SenseVoice Small의 내부 테스트를 진행 중입니다. 기술적 특징과 온디바이스 적용 가능성을 탐구합니다.

Tech Insights

OpenAI Whisper v3 도입을 위한 기술적 검토 및 테스트

VORA의 차세대 엔진으로 Whisper v3-large를 검토 중입니다. 브라우저 환경에서의 실행 가능성과 한국어 인식 성능 테스트 결과를 공개합니다.

Dev Log

회의 요약 타이머 버그: setInterval이 신뢰할 수 없는 이유

요약이 30초, 5분, 그리고 영영 안 뜨는 버그의 원인을 파헤쳤습니다. JavaScript 타이머 메커니즘 심층 분석과 재귀 setTimeout 패턴으로 완전히 해결한 과정.

Dev Log

Groq 이중 AI 통합: 두 번째 AI를 추가한 이유와 무엇이 달라졌나

xAI Groq 통합의 아키텍처 결정, 첫날 잘못된 모델명으로 발생한 400 에러, 그리고 이중 AI가 실시간 보정 지연에 실제로 가져다 준 것들.

Dev Log

화자 식별을 없앤 이유 — 2주간의 실패 기록

화자 분리 기능을 만들고, 배포하고, Web Speech API의 구조적 한계를 깨닫고 전부 삭제하기까지. 완전한 사후 분석 보고서.

Dev Log

Python 서버에서 순수 브라우저로: 모든 것을 바꾼 아키텍처 전환

VORA는 Python FastAPI + Faster-Whisper로 시작했습니다. 그것을 전부 삭제했습니다. 3:1의 수정 대 기능 비율이 "그냥 Web Speech API를 쓰면 어떨까?"라는 질문을 강제했습니다.

Tech Insights

Whisper WASM 실험: 브라우저에서 AI 실행이 보기보다 어려운 이유

벤치마크, CORS/SharedArrayBuffer 악몽, 그리고 실시간 한국어 음성 인식에서 브라우저 Whisper가 실용적인 경우와 그렇지 않은 경우에 대한 솔직한 수치.

Dev Log

우선순위 큐 구축: 처음 두 Gemini API 설계가 모두 실패한 이유

3번의 완전한 재설계: 병렬(경쟁 조건), 뮤텍스(우선순위 역전), 그리고 마침내 우선순위 큐. 각각의 실패를 실제 코드와 함께 자세히 설명합니다.

Dev Log

다크 테마 재설계: 전문적인 도구처럼 보이는 UI 구축

3번의 UI 개편. 이퀄라이저 애니메이션을 두고 2주간의 논쟁. "작동하는 프로토타입"에서 "사람들이 칭찬하는 제품"으로 변화시킨 디자인 결정들.

Tech Insights

더 나은 한국어 STT를 위한 N-Best 후보 재순위 — API 호출 0회

Web Speech API는 여러 가설을 반환합니다. 도메인 인식 로컬 재순위 시스템이 최선의 것을 선택 — API 호출 없이 전문 용어 점수로 WER 8% 향상 달성.

Dev Log

실제 회의 내보내기 구축: 원본 트랜스크립트에서 전문 리포트까지

3번의 반복: 텍스트 덤프, 템플릿 HTML, AI 생성 개조식 회의록. Gemini로 제대로 된 한국어 비즈니스 문서를 작성하게 만든 프롬프트 엔지니어링.

Tech Insights

로컬라이제이션 프레임워크 없이 VORA를 이중 언어로 만든 방법

이중 HTML 파일, hreflang 태그, 12개의 깨진 링크를 발견한 언어 일관성 감사, 그리고 i18n 라이브러리 대신 파일 복제를 선택한 이유 — 솔직한 회고.

Dev Log

브랜딩 여정: "AI Conference Assistant"에서 VORA로

3번의 이름 변경, "Voice Oracle" 우회로, 그리고 배포된 제품의 이름을 바꾸는 것이 처음부터 올바른 이름을 선택하는 것보다 훨씬 비싼 이유.

Tech Insights

Cloudflare Pages로 배포하기: 정적 호스팅, CORS 헤더, 그리고 Sitemap 사건

3주간의 Google 인덱싱을 날려버린 sitemap/robots.txt 배치 실수, Google Fonts와의 CORS 헤더 충돌, 그리고 모든 Cloudflare Pages 개발자가 알아야 할 _headers 파일 형식.