@bglbgl gwyng 아무래도 Gemini 시리즈가 컨텍스트 윈도가 길어서 그런 것도 큰 것 같아요. 다른 모델은 중간에 compaction을 해야 하니까 아무래도 대화가 길어지면 손실이 있고 말이죠.
@hongminhee洪 民憙 (Hong Minhee) 아항 그렇군요. 근데 제가 대화양을 컨텍스트 윈도에 잘 대응을 못시키겠네요. 정말 다른 모델은 컨텍스트 윈도가 이미 꽉찼을만큼 대화가 긴건 아니었다고 생각햇는데요. 이것도 토큰수를 직접 세보기 전엔 모르겠네요.
If you have a fediverse account, you can quote this note from your own instance. Search https://hackers.pub/ap/notes/01960973-d756-797d-a9fb-2b0146b6562f on your instance and quote it. (Note that quoting is not supported in Mastodon.)