Profile img

구슬아이스크림

@icecream_mable@hackers.pub · 45 following · 31 followers

인간의 언어처리와 LLM의 언어처리를 서로 비교하는 전산심리언어학(Computational Psycholinguistics)을 연구했'었'습니다.

하지만 CS덕질이 더 재밌다는 걸 깨닫고선 대학원을 탈출했습니다.

요즘은 데이터 엔지니어링과 컴파일러가 재밌어요.

Github
@kihyo-park
Blog
kihyo-park.github.io
Linkedin
kihyo-park

Perl을 만든 언어학자 Larry Wall이 쓴 글 중에 종종 다시 읽어 보는 글

Human languages therefore differ not so much in what you can say but in what you must say. In English, you are forced to differentiate singular from plural. In Japanese, you don’t have to distinguish singular from plural, but you do have to pick a specific level of politeness, taking into account not only your degree of respect for the person you’re talking to, but also your degree of respect for the person or thing you’re talking about.

Programming is Hard, Let's Go Scripting...

그렇기 때문에 사람의 언어는 당신이 그렇다고 생각하고 있던 것과는 많이 다르다. 영어로 얘기할때는 단수와 복수를 확실히 구분해야만 한다. 일본어에서는, 단수와 복수를 구분할 필요는 없지만, 정중함의 정도를 조절할 줄 알아야 한다. 즉, 상대방에 대한 존경을 표현할 수 있는 정도를 선택해야 하고, 상대방의 입장에서 내가 존중 받아야 하는 정도를 생각해서 말해야 한다.

프로그래밍은 어렵다, 스크립팅의 세계로 가보자...

9

덕질하고 싶은 프로그래밍 언어도 많고 CS개념도 많고 프레임워크도 많고 취업을 위한 딩코보다는 그냥 내가 재밌어서 하는 딩코도 원없이 하고 싶고 그러고 싶당 누가 시간과 정신의 방을 만들어줬으면 좋겠어

2

올만에 컴파일러 lexical analysis 설명 읽으니깐 짱 재밌으면서도 동시에 쓰여진 코드도 이해하려고 하니깐 머리가 터질 것 같군...닝겐이 자연어를 처리하는 과정도 재밌는데 기계가 입력 기호들을 처리하는 걸 들여다볼 수 있다는 사실 그 자체가 되게 신기한 것 같다. 전자는 언어라는 추상적 정보를 뭉탱이로 있다가 유링게슝하게 여러 층위로 쪼개서 (예: 통사, 의미) 순차적 혹은 병렬적으로 처리한다는 게 재밌고 후자는 기호를 임의의 단위로 쪼개는 과정들을 구현 수준에서 디테일하게 볼 수 있다는 게 짱 신기하다...여튼 머리도 식힐 겸 운동하러 가야지.

2

LWN.net의 What every programmer should know about memory 시리즈를 훑어 보고 나서 든 생각인데, 현대적인 컴퓨터의 메모리 모델이란 건 사용성 관점에서는 놀라울 정도로 투명하게 추상화되어 있으면서 동시에 성능 관점에서는 무시무시할 정도로 새는 부분이 많은 추상화인 것 같다.

인상깊었던 부분 중 하나는, 코드를 실행해 보기 전에는 완벽한 최적화가 사실상 불가능한 메모리 접근 패턴이 드물지 않게 발생할 수 있다는 건데, 이런 부분 때문에 JIT 컴파일러가 AOT 컴파일보다 잠재적으로 더 우수한 성능을 낼 수 있다는 주장이 있었던 걸까 싶다.

6

취미로 하고 있는 오타쿠 밴드의 로고를 만들어해야하는데 똥손이라서 Canva + Gemini로 해서 프롬프트 갓챠 성공해서 밴드 사람들한테 뿌리고선 고르라고 했다. 근데 문득 궁금한 게 이러면 저작권은 어디로 가는 걸까 싶어서 호기심에 미국 저작권청 문서국내 저작권위원회 문서를 보려다가...그냥 할 일 해야지

3
0
3
0
0
0

저번에 산 RDB 책 보면서 글로 정리하고 있는데 연구덕질 습관이 다시 발현되어서 정신 차리고 보니 DB 교과서들에서 수리적으로 정의하는 것들까지 들여다보고 있는데 진짜 열 살 버릇 여든까지 가는 거 맞는 것 같음...아직 초반 챕터들인뎅..적당한 시점에서 가지치기를 끝낼 줄 알아야하는데 이걸 조절하는 게 늘 힘들다.

0
2

지금 리눅스 진영에서 컨테이너/네임스페이스의 입지가 어떻게 될까요? 사실 요즘 서비스 배포할때는 죄다 컨테이너 쓰잖아요? 근데 또 컨테이너로 할수 있는 것중 상당수는 그냥 기존 권한 관리로도 가능하단 말이죠? 근데 컨테이너를 쓸땐 기존 권한 관리를 그냥 없는셈 치고 접근하게 되는데 이게 정말로 다들 동의하는 방식인지가 궁금합니다.

3
2

컴파일러 책 얇은 거 하나 읽고 있는데 문맥자유문법(CFG)이 나와서 오랜만이야 친구 하면서 보는 중...언어학 덕질했던 사람으로선 이걸 보니 하나 떠오르는 게 하나 있는데, 1957년 Syntactic Structures에서 촘스키는 이 CFG를 갖고 닝겐의 자연어가 지니는 통사적 성질(의미 아님)을 마르코프 과정을 통해서 설명하기엔 한계가 있음을 지적하며 변형문법(Transformational Grammar)를 제안한 게 생각난다. 즉, 닝겐 자연어의 통사 정보를 설명할 문법을 제안한 것(다시 한 번 말하지만 의미가 아님). 물론 이후엔 훨씬 더 발전하고 추상화됐고, PCFG라 하여 CFG에 확률을 넣은 CFG 확장판도 있다[1]. 참고로 오토마타 이론에서 나오는 촘스키-슈첸버거 위계나 촘스키 정규형할 때 얘기하는 그 촘스키 맞다.

개인적으로 촘스키의 저 시절 연구들이 되게 재밌다고 생각하는데 (물론 훑어만 봤지만...) 이후엔 사실상 오토마타 이론쪽으론 손 뗀 것 같아서 좀 아쉽기도 함...여튼 컴파일러 책 보다가 갑자기 생각나서 씀. 그나저나 도대체 난 언제 쯔음 나만의 프로그래밍 언어를 만들 수 있을까?


  1. 정규언어에서 은닉 마르코프 모형으로 확장시키는 거랑 똑같다. ↩︎

8
6
2
0

대학원 다닐 때 CS 수업들 중에 재밌어 보이는 걸 몇 개 청강했었는데 그 중 하나가 DB 수업이었고 되게 재밌게 들었었음...이후에 SQL 덕질(=공부)하다가 하면 할수록 RDB를 다시 좀 제대로 훑어봐야겠다란 생각이 들어서 이리저리 찾다가 발견한 책. 괜찮은 책인 것처럼 보였는데 절판이어서 못 구하다가 어떻게 중고로 구했다. 서문 보니깐 SQL 쿼리들을 어떻게 쓰는가에 대해선 책이 많지만 정작 RDB가 무엇이고 이걸 어떻게 사용하는가를 쉽게 요약해서 정리한 책이 없어서 작가가 책을 썼다고 하는데, 잘 산 것 같음...이거 보고 나면 다른 유명한 SQL 튜닝 책들 봐야지.

개발 서적입니다.

제목: 관계형 데이터베이스 실전 입문
지은이: 오쿠노 미키야
옮긴이: 성창규
5

最近(최근) 한창 開發中(개발중)인 Fedify 基盤(기반) ActivityPub 서비스 2():

完全(완전) 期待中(기대중)!!

6

구슬아이스크림 shared the below article:

페디버스에서 어떤 사람들을 팔로하면 좋을까?

Jaeyeol Lee @kodingwarrior@hackers.pub

페디버스 입문이 막막한 개발자들을 위해, Hackers' Pub을 포함한 ActivityPub 기반 서비스 활용법을 소개합니다. 트위터와 달리 추천 기능이 부족한 페디버스에서, 어떤 인스턴스를 선택하고 누구를 팔로우해야 할지 어려움을 겪는 분들을 위해 유용한 정보들을 제공합니다. 먼저, 개발자들이 많이 모여있는 국내외 마스토돈 인스턴스들을 소개합니다. silicon.moe, hachyderm.io, emacs.ch 등 다양한 관심사에 맞는 인스턴스를 선택할 수 있습니다. 또한, Geeknews Bot, Hacker News, Lobsters 등 개발 관련 뉴스를 제공하는 계정들과, Mastodon, Golang, Asahi Linux 등 오픈소스 프로젝트에 기여하는 개발자들을 팔로우하여 유용한 정보를 얻을 수 있습니다. 이 글은 페디버스 생태계에서 개발자들이 양질의 정보를 얻고 소통할 수 있도록 돕는 것을 목표로 합니다. 페디버스 입문자들이 자신에게 맞는 인스턴스와 계정을 찾아 팔로우함으로써, 더욱 풍부하고 유익한 경험을 할 수 있도록 안내합니다.

Read more →
7
6
4
1

요즘 오에카키 같은 2000년대 초반 인터넷 유물?같은 게 종종 머릿속에 떠오르는데 분명 내가 어릴 때여서 추억화된 것 때문인 걸 알고 있음에도 그 시절 인터넷 서브컬쳐들이 좀 그리울 때가 있다. 뭔가 그 특유의 투박한 디자인들이 자꾸 떠오름...

5

CS를 나름 제대로 덕질했다고 생각한지 대충 1년 차...대학원에서 딩코할 때는 자료구조니 뭐니 그런 거 1도 모르는 상태에서 그저 돌아가기면 하면 된다란 마음으로 내가 무슨 코드를 쓰고 있는지 조차 모르면서 막 복붙해서 썼고, 솔직히 간단한 유저 정의 함수 조차도 스스로 못 짜는 수준이었는데 요즘은 그 때보다는 한 2% 정도는 나아진 것 같다란 생각이 든다. 그리고 무엇보다 딩코가 대학원 때와는 다르게 재밌다는 점...나 잘 하고 있는 거 맞겠지?

2
2
0