Profile img

구슬아이스크림

@icecream_mable@hackers.pub · 61 following · 45 followers

인간의 언어처리와 LLM의 언어처리를 서로 비교하는 전산심리언어학(Computational Psycholinguistics)을 연구했'었'습니다.

하지만 CS덕질이 더 재밌다는 걸 깨닫고선 대학원을 탈출했습니다.

요즘은 데이터 엔지니어링과 컴파일러가 재밌어요.

Github
@kihyo-park
Blog
kihyo-park.github.io
Linkedin
kihyo-park
1

오타쿠 밴드 하는 거 뭔가 이것저것 실무적인 것들이 생겨나고 있는데 (로고, 합주/공연 일정, 합주곡, 합주영상 등등) 구글 드라이브에 넣으니깐 정리도 잘 안되고 그래서 우리만 쓰는 작은 웹사이트같은 거나 하나 만들까 생각 중인데 어디서부터 시작해야하지...?

0
2
1

예전에 참여했던 NLP 관련 프로젝트 중에 하나가 한국어에 특화된 연구였는데 1저자분께서 고군분투 하신 끝에 2번인가 리젝 먹고 억셉 받았지만 그 때 받았던 리뷰 중 하나가 왜 한국어 특화된 연구를 하느냐란 어투가 물씬 느껴지는 코멘트였는데 (대놓고 말하진 않았음) 보면서 진짜 전형적인 영어 중심적인 생각이 느껴져서 속으로 좀 기분이 그랬던 적이 있었음...물론 궁극적으론 특정 언어에 구애받지 않는 language agnostic한 걸 추구하는 거겠지만 그러기 위해선 language specific한 연구와 데이터 또한 구축하는 것 또한 이루어져야 하는 거 아닌가 하는 생각임..적어도 원론적으론.

2
1
1

좀 하찮은 것처럼 보일 수도 있는데 배열에 미리 값들을 0이나 Null 같은 걸로 미리 채워놓는 initialization 단계는 뭐랄까 나한텐 되게 항상 신선하게 다가온다. 보통 사람들은 이미 자신이 원하는 특정 값들이 채워진 채로 논리를 시작하는 것 같은데 (반박시 여러분 말이 맞음) 딩코에서는 빈칸이라는 개념을 저렇게 시작하는 게 되게 신기하게 느껴짐...나만 그런가? 아마 나만 그런 거겠지?

1
1
3

깃헙 레포 커밋 히스토리 좀 보다가 깃헙에선 레포를 다운받지 않는 이상, 최초 커밋부터 최근까지 브라우징 해주는 건 좀 귀찮게 해야한다는 걸 알고선 어제 오늘 해서 틈틈히 짬내서 로컬에서 깃헙 API의 list commit 끌어다가 pagination해서 일단은 기존 깃헙처럼 가장 최근 것부터 최초 커밋까지 쭉 브라우징 해주는 거 날먹으로(?) 구현해봤는데, 5000여개 남짓 커밋들로 이루어진 레포만 해도 다 불러내는데 1분 가까이 걸려가지구 아..좀 큰 레포 갖고 하려면 API rate limit 터지고 불러오는데 몇 시간 걸리는 건 예삿일도 없겠구나 싶었다란 생각이 들었다. 그래도 오랜만에 scratch your own itch 해주는 거 만들어서 좋았고 생각보다 배운 것도 꽤 많아서 재밌었당.

커밋 로그
1
0

최근 몇 주 동안 딩코하는데 현타가 와서 사실 IDE 조차도 안 키고 딩코를 거의 안 했는데, 포스트 쓰니깐 다시 하고 싶은 마음이 든다. 사실 아직도 나한텐 딩코가 어렵고 버겹게 느껴진다. 특히 리트코드 풀고 있으면 더 그럼...쉬운 것부터 하고 그냥 자기가 평소에 불편해했던 걸 간단하게 프로그램으로 짜라고 하던데 그것마저도 부담스럽게 다가올 때도 많음. 머리에 든 것만 많아져서 눈 딱 감고 그냥 덤벼야하는데 자꾸 준비에 준비에 준비라는 회오리에 빠질 때가 잦음. learning by doing이라던데 난 endless preparing for doing임 ㅋㅋㅋ 그래도 다시 딩코 하고 싶어져서 좋다. 뭔가를 만들고 싶어...!

2

존 카맥, 리누스 토르발스 등등 90년대 시절 프로그래머들이 살아있는 전설급 프로그래머로 여겨지는 이유를 썰 풀듯 드립치며 얘기하는 영상. 이유는 간단하게 말하면 오늘과는 다르게 그 시절엔 하드웨어 메모리를 어떻게든 쥐어짜서 로직을 짜야했고, pip install이나 클로드나 제미나이같은 것도 없었고 튜토리얼 지옥에 빠질 일도 없었고 대신 컴파일러 지옥에서 살았기에 가능했다는 얘기. 물론 그들이 선구자였기에 그 버프를 받아서 전설급이 되었을 거란 얘기도 있다. 보면서 그 때는 정보가 적었기에 폐관수련이 필수였는데 오늘날엔 오히려 정보가 넘쳐나고 풍부해서 그게 좀 덜 하는 걸까 싶기도 했다.

1
4

집 인터넷이 자정~새벽 1시 사이만 되면 이상하게 버벅대는데 매일 점검하는 건가 싶으면서도 무슨 메가패스 시절도 아니고 요즘같은 시대에도 매일 점검하는 게 로컬에도 영향을 끼칠 정도인가 하는 생각도 들고 하여튼 뭔가 좀 꼬롬함..크게 불만은 없어서 그냥 쓰고 있긴 하지만..ㅎ

0
5
3
0
1
0

기술블로그 잘 쓴 거 보면 간단명료하게 쓰던데 난 논문 쓰던 버릇[1] 때문에 어지간하면 다 풀어서 써야지 성미가 풀리는 성격이어서 처음엔 좀 스트레스를 받았는데 요즘은 그냥 내 방식대로 쓰고 그게 편하긴 하다 사실


  1. 정확히는 독자를 특정 분야에 관심 있어하는 고학년 학부생 아니면 석사 1년 차로 가정해 놓고 함 ↩︎

3

내 거 블로그 연합우주에 연동되게 해야겠다. astro 기반인데 (정확히는 astro-erudite) 잘 할 수 있을까? 사실 astro가 뭔지도 잘 감이 안 오고 프론트엔드는 해본 적도 없음(백엔드도 마찬가지)...ㅋㅋㅋ 어디서부터 시작해야할지 모르겠지만 일단 astro 문서부터 쭉 덕질해야할 듯...그 다음엔 뭐 어떻게 해야하는 걸까..?

2
0

얼마 전 웹서핑을 하다가 우연찮게 현재 앤트로픽에서 엔지니어이자 연구원으로 근무하고 있는 Nelson Elhage가 쓴 Computers can be understood(=컴퓨터는 이해가능하다)라는 글을 봤습니다. 다 읽고나니 이 분 마인드가 제가 평소에 CS 공부할 때랑 너무 비슷해서 공감이 가고 아직 CS 뉴비인 저한텐 굉장히 도움이 되는 한편, 이 마인드가 어떠한 단점을 또한 가져다주는지 잘 얘기하는 것 같아 (사실 읽으면서 뜬끔하는 게 많았음) 저만 알기엔 아까워서 이렇게 번역해서 올려봅니다.

번역된 글을 보려면 여기로 이동해주세용.

혹시나 오역 및 CS 용어에 문제가 있다면 언제든 알려주시면 감사하겠습니다.

8

개인홈피에 새포스트 올리려고 localhost에서 테스트 하고 있었는데 분명 파일이 있는데 자꾸 없다고 해서 않이 외 안되 하고 있었는데 cache 쌓인 거 때문에 그런 거였음...그래서 cache 지우고 다시 키니깐 된다. 역시 컴퓨터 껐다 켰나요 혹은 다 지우고 다시 깔아봤나요가 최고다.

1

개인적으로 뭐 번역할 때 시간 많으면 어지간하면 초벌번역은 내가 다 하는데 그렇게 해놓고서 LLM한테 해달라고 하면 얘가 너무 잘해서 자존심 좀 상할 때가 있다. 그럼 쓰잘데기없이(??) 독기랑 경쟁심 생겨서 더 열심히 초벌 번역하게 되는데, 그러다가 내가 지금 기계랑 자존심 싸움하는 것 같아서 현타올 때가 가끔 있다. 물론 아뎁투스 메카니쿠스의 테크 프리스트에 빙의해서 기계신의 가호를 요청할 때도 있긴 함.

1
4
0
1

잠깐 동안 기가 팍 죽었지만 그럼에도 불구하고!!! 여러가지 피드백을 받을 수 있어서 좋았고 내 스스로에게도 줄 수 있어서 좋았고 무엇보다 내가 딩코 실력이 지금 어느 정도인지(=처참한지) 알 수 있어서 무엇을 더 공부해야하고 연습해야하며 습관화 해야할지 머릿속에 명확하게 딱 떠올라서 굉장히 유용했음!!

1

와우 코딩테스트 mock interview 했는데 개털림 ㅋㅋㅋ 심지어 풀었던 건데 못 풀고 난리도 아니었음...1) 누군가 내가 코드하는 걸 보고 있다 2) 그 코드하는 걸 내가 설명해야한다 3) 시간 제한이 있다 4) 여러가지 티키타카하면서 주고 받아야한다 이 4가지가 한꺼번에 팍 오니깐 와우 가장 기본적인 것들도 어버버버 하고 패닉와서 나 왤케 멍청하지 하면서 그냥 별 생각없이 풀 때랑은 차원이 다르다는 걸 깨달았습니다..

3

자기 전에 What every programmer should know about memory 읽고 잘까 싶었는데 길어봐야 20쪽 좀 안되는 평범한 CS 페이퍼인줄 알았다가 two-column layout에 appendix 포함해서 100쪽이 넘는다는 걸 알고선 그냥 이부자리 폈음...DB 책 지금 읽는 거 다 읽으면 봐야겠다

1

리트코드 1주 할당치 다 풀었다...내일부터 또 1주 할당치 풀어야함..역시 나같은 닝겐은 데드라인이 있어야 일을 한다..다 풀고 나면 문제를 더 풀기보단 그 동안 풀었던 거 쭉 다시 보시면서 제대로 내 걸로 만들어야지.

1
2
0

리트코드 문제들 풀고 좀 쉬다가 갑자기 일본어에서 어떤 동사일 때 목적어에 を가 아니라 が를 붙이는지 꽂혀서 일본 언어학계에서 고전으로 취급받는 문법서[1] 좀 보다가, 다시 리트코드 풀려고 하니깐 배고파서 머리가 안 돌아가네...라고 생각한 순간 점심 타임인 걸 깨달았다. 뭐 먹지?


  1. 학교 국어/영어 시간에서 보는 문법책이랑은 다르다. 그런 문법은 보통 규정문법(prescriptive grammar)이라고 하고, 언어학에서는 어떤 언어가 보이는 임의의 현상들을 이론적으로 기술한다는 점에서 기술문법(descriptive grammar)이라고 함. ↩︎

1
2
7

Core function은 tinyld 라이브러리에서 나오는 것 같은데 소스코드 보니깐 엔그램 썼구나...! 그래 맞아 길어봐야 몇 문장일 거고 사실 최초 몇 단어 혹은 몇 자, 그리고 어떤 문자인지에 따라 (CJKV 같은 계열엔 더욱 더 명확할 거임) 바로바로 detection 하면 되는 걸테니 굳이 복잡시리한 거 안 써도 됨...내 최애 언어모델 엔그램 🥹 (다른 건 LSTM 🥹)

4

해커스펍을 쓰고 있으면서도 정작 연합우주랑 액티비티펍 프로토콜에 대해선 큰 그림조차 사실 감이 잘 안 왔는데(...) 워드프레스에서 작년에 연합우주랑 액티비티펍 관련해서 영상들을 몇 개 올려서 보고 있는데 한방에 팍 이해가 되어서 재밌게 보고 있다. 액티비티펍 공동창시자인 Evan Prodromou랑 찍은 것도 있는데 왜 액티비티펍을 만들었는지에 대한 동기도 설명해줘서 좋았음..

2
1

일본어 과외 받은지 한 세 달? 정도 되어가는데 아직 많이 부족하지만 그래도 흥미는 잃지 않고 계속 배우고 있다. 처음 배웠을 때보다 엄청 많이 늘었고. 선생님이 한일 혼혈분이셔서 한국어도 잘 하고 일본어도 잘 하셔서 회화 중심으로 해서 잘 배우고 있음. 일주일에 한 번은 일본 사는 지인이랑 언어교환도 하고...흔히들 한국어랑 일본어가 비슷하다고 하는데 언어학 관점에서 보면 일본어는 한국어에 비하면 비단 경어에서뿐만 아니라 전체적으로 문법체계가 굉장히 엄격한 느낌이다...그나저나 지인분도 그렇고 선생님도 그렇고 일본 와서/가서 일해보는 거 어떠냐고 종종 꼬시는데(?) 생각을 안 해 본 건 아니어서 좀 고민 중이다. 하지만 난 아직 실무 경험이 없는 걸...가방끈만 애매하게 김..흑

1
0

리트딩코 3개 풀었다..이지 문제들은 로직 짜는데는 성공했지만 구현에서 막혀서 살짝 고생했고 미디엄은 처음엔 이거 스택으로 푸는 건가 했는데 그러면 너무 복잡해져서 한 30분 고민하다가 솔루션 보니깐 그냥 인풋을 하향식으로 정렬시키면 좀 쉬워진다는 걸 깨달음..근데 푸는 방식이 좀 흥미로워서 재밌게 풀었다. 이제 DB 책 읽어야지..오늘은 relational algebra/calculus 읽을 거임. DB 수업 들었을 때도 제일 재밌게 들었던 파트 중 하나였는데 다시 보려고 하니깐 설렌다.

2
1
1