출력량 조절은 답변 길이(출력량)와 생각(추론) 깊이를 슬라이더로 직접 조절할 수 있는 기능입니다.
베이비챗의 모든 모델은 1회 대화 시 기본 설정(1x, 빠름) 기준으로 최대 1,200토큰까지 답변합니다. 출력량 조절 기능을 사용하면 이보다 더 길고 자세한 답변을 받을 수 있으며, 기본 보장량인 1,200토큰을 초과한 부분에 대해서만 프로챗이 추가로 차감됩니다.
출력량 조절 기능을 사용하지 않으면 추가 비용이 발생하지 않습니다.
이용 조건
보유 프로챗(이벤트 프로챗 포함)이 1,000개 이상일 때부터 이용할 수 있습니다.
단, [2차 창작봇] 이용 시에는 정책상 '결제하신 구매 프로챗'이 보유량 합산에 포함되지 않습니다.
이벤트 프로챗으로도 이용이 가능합니다.
입력창의 출력량 조절 슬라이더를 통해 출력량과 생각(추론)을 각각 조절할 수 있습니다.
배수를 높일수록 더 길고 상세한 답변을 받을 수 있습니다.
설정 | 설명 |
|---|---|
1x | 기본 길이 |
1.25x | 약 1.25배 길이 |
1.5x | 약 1.5배 길이 |
2x | 약 2배 길이 |
3x | 약 3배 길이 |
4x | 약 4배 길이 |
생각 설정을 높이면 AI가 답변을 도출하기 전에 더 깊은 사고 과정을 거치게 되어, 보다 정교하고 품질 높은 답변을 얻을 수 있습니다.
설정 | 설명 |
|---|---|
빠름 | 빠른 응답 |
보통 | 기본 수준의 추론 |
깊음 | 심층 추론 |
생각 설정 지원 모델: Gemini 2.5 Pro, Gemini 3.0 Flash, Gemini 3.0 Pro, Gemini 3.1 Pro
기본 설정 범위 내에서는 추가 비용 없이 자유롭게 사용할 수 있습니다.
보장량을 초과한 부분에 대해서만 프로챗이 차감됩니다.
OpenAI GPT 5.1, Claude 4.6 Sonnet, Claude 4.6 Opus, Gemini 3.0 Flash, Gemini 3.1 Pro
구분 | 토큰 보장량 |
|---|---|
출력량 | 1,200토큰 |
합계 | 1,200토큰 |
Gemini 3.0 Flash와 Gemini 3.1 Pro는 생각(추론) 설정을 추가로 활성화할 수 있습니다. 생각 기능을 사용하지 않을 경우, 출력량 보장 1,200토큰이 그대로 적용됩니다.
Gemini 2.5 Pro, Gemini 3.0 Pro
이 모델들은 답변 시 내부적으로 생각(추론) 과정을 자동으로 수행하며, 이 과정에서도 토큰이 사용됩니다. 이에 따라 토큰 보장량이 답변 출력과 생각에 나뉘어 제공됩니다.
구분 | 토큰 보장량 |
|---|---|
출력량 | 1,000토큰 |
생각 | 200토큰 |
합계 | 1,200토큰 |
보장량을 초과한 토큰은 100토큰 단위로 계산되어 프로챗으로 차감됩니다.
차감량은 AI의 응답이 완료된 후, 실제로 사용된 토큰을 기준으로 확정됩니다.
모델 | 출력량 | 생각 |
|---|---|---|
Gemini 3.0 Flash | 2 프로챗 | 1 프로챗 |
Gemini 2.5 Pro | 5 프로챗 | 3 프로챗 |
OpenAI GPT 5.1 | 5 프로챗 | - |
Gemini 3.1 Pro | 7 프로챗 | 4 프로챗 |
Gemini 3.0 Pro | 7 프로챗 | 4 프로챗 |
Claude 4.6 Opus | 15 프로챗 | - |
Claude 4.6 Sonnet | 10 프로챗 | - |
예시 1) Claude 4.5 Sonnet으로 1,500토큰 답변을 받은 경우
초과분은 1,500 - 1,200 = 300토큰이며, Claude 4.5 Sonnet의 출력량 차감 단가는 100토큰당 10 프로챗이므로 30 프로챗이 추가로 차감됩니다.
예시 2) Gemini 2.5 Pro로 출력 1,100토큰 + 생각 300토큰을 사용한 경우
출력 초과분은 1,100 - 1,000 = 100토큰이며, 100토큰당 5 프로챗이 차감됩니다. 생각 초과분은 300 - 200 = 100토큰이며, 100토큰당 3 프로챗이 차감됩니다. 따라서 총 8 프로챗이 추가로 차감됩니다.
비용 참고사항
출력량이나 생각 설정을 높이더라도, 실제 비용이 항상 낮은 설정보다 높게 나오는 것은 아닙니다. 프로챗 차감은 설정값이 아닌 AI가 실제로 사용한 토큰을 기준으로 계산되기 때문에, 높은 설정에서 AI가 간결하게 답변한 경우 낮은 설정보다 오히려 비용이 적게 부과될 수 있습니다. 설정 배수는 출력의 상한을 넓혀주는 역할이며, 매번 해당 배수만큼의 토큰이 소모되는 것은 아닌 점을 참고해 주세요.
1. 설정을 마친 후 ‘새 대화’를 시작해 주세요 .
대화가 이미 진행 중인 상태에서 설정을 바꾸면 AI가 이전의 대화 규칙과 혼동을 일으켜 기대한 효과가 나타나지 않을 수 있습니다.
캐릭터와 새로운 서사를 시작하기 전, 슬라이더를 먼저 조절해 주시는 것이 가장 확실한 방법입니다.
2. 배수 설정은 AI의 ‘목표치’입니다.
1.5x, 2x와 같은 배수는 AI가 최대한 그 길이에 맞춰 대답하도록 노력하는 기준점입니다.
하지만 대화의 문맥이나 주제에 따라, 가장 자연스러운 흐름을 위해 답변 길이가 목표치보다 조금 짧거나 길어질 수 있습니다. AI가 서사의 완성도를 위해 스스로 판단하는 과정이니 너그럽게 이해 부탁드립니다.
3. ‘생각의 깊이’는 대화 내용에 따라 가변적입니다
AI도 사람처럼 복잡한 상황이나 깊은 감정 묘사가 필요한 대화에서는 더 많은 고민을 하게 됩니다.
동일한 설정이라도 대화의 주제가 얼마나 깊이 있느냐에 따라 내부적으로 소모되는 토큰 양은 조금씩 달라질 수 있습니다. 이는 유저님께 최적의 지능을 제공하기 위한 AI의 사고 과정입니다.