지속학습능력과 관련된 문제로
A라는 데이터로 curve fitting 했는데 B라는 데이터가 새로 들어왔을때 A+B로 curve fitting 하면 될듯한데 그러면 문제를 매번 다시 푸는것이어서 비효율적입니다.
그래서 강화학습이라는 것에서 추가되는 B만 가지고 curve fitting 을 하는데 이게 매우 불안정해서 해에 수렴했다가도 발산하는 경우가 자주 있습니다.
RE: https://bsky.app/profile/did:plc:v2ob6je7otkaffdktzdaywzp/post/3mfgy4c7ttk2i
If you have a fediverse account, you can quote this note from your own instance. Search https://bsky.brid.gy/convert/ap/at://did:plc:ufwz6xoegq3wrp6agnavzxza/app.bsky.feed.post/3mfgyp5uwd22k on your instance and quote it. (Note that quoting is not supported in Mastodon.)