Profile img

구슬아이스크림

@icecream_mable@hackers.pub · 61 following · 45 followers

인간의 언어처리와 LLM의 언어처리를 서로 비교하는 전산심리언어학(Computational Psycholinguistics)을 연구했'었'습니다.

하지만 CS덕질이 더 재밌다는 걸 깨닫고선 대학원을 탈출했습니다.

요즘은 데이터 엔지니어링과 컴파일러가 재밌어요.

Github
@kihyo-park
Blog
kihyo-park.github.io
Linkedin
kihyo-park

얼마 전 웹서핑을 하다가 우연찮게 현재 앤트로픽에서 엔지니어이자 연구원으로 근무하고 있는 Nelson Elhage가 쓴 Computers can be understood(=컴퓨터는 이해가능하다)라는 글을 봤습니다. 다 읽고나니 이 분 마인드가 제가 평소에 CS 공부할 때랑 너무 비슷해서 공감이 가고 아직 CS 뉴비인 저한텐 굉장히 도움이 되는 한편, 이 마인드가 어떠한 단점을 또한 가져다주는지 잘 얘기하는 것 같아 (사실 읽으면서 뜬끔하는 게 많았음) 저만 알기엔 아까워서 이렇게 번역해서 올려봅니다.

번역된 글을 보려면 여기로 이동해주세용.

혹시나 오역 및 CS 용어에 문제가 있다면 언제든 알려주시면 감사하겠습니다.

0

백준 등 프로그래밍 문제에서 계산한 결과를 10^9+7로 나눈 나머지를 출력하라 지시하는 경우가 많은데, 오버플로우를 막기 위함인건 알았지만 그 값을 소수로 사용하는 이유는 오늘 처음 알았다. 그 값이 소수여야 모듈러 곱셈 역원을 구할 수 있기 때문이다. (10^7+9는 10자리인 첫 번째 소수이기 때문에 자주 사용된다고 한다.)

풀어 말하자면 실수에서 2를 나누는 것과 1/2를 곱하는 것 대신 군 안에서는 2를 나누는 대신 모듈러 했을 때의 곱셈 역원인 정수를 대신 곱해줄 수 있는데, 모듈러하는 값이 소수일 때만 곱셈 역원이 항상 존재한다.

예시: 팩토리얼, 조합 경우의 수와 같이 매우 큰 수를 계산할 때 곱셈 역원을 사용할 수 있음

C(n, k) = n! x (k!)^-1 x ((n-k)!)^-1 (mod p)

소수가 아닌 경우 아래같은 케이스가 있음 e.g. (m = 8, a = 1, b = 2) 1 / 2 mod{8}을 구할 수 없음

  • x: 2x mod 8
  • 0: 0
  • 1: 2
  • 2: 4
  • 3: 6
  • 4: 0 ... 반복

https://www.geeksforgeeks.org/dsa/modulo-1097-1000000007 https://www.quora.com/What-exactly-is-print-it-modulo-10-9-+-7-in-competitive-programming-web-sites

5
0

얼마 전 웹서핑을 하다가 우연찮게 현재 앤트로픽에서 엔지니어이자 연구원으로 근무하고 있는 Nelson Elhage가 쓴 Computers can be understood(=컴퓨터는 이해가능하다)라는 글을 봤습니다. 다 읽고나니 이 분 마인드가 제가 평소에 CS 공부할 때랑 너무 비슷해서 공감이 가고 아직 CS 뉴비인 저한텐 굉장히 도움이 되는 한편, 이 마인드가 어떠한 단점을 또한 가져다주는지 잘 얘기하는 것 같아 (사실 읽으면서 뜬끔하는 게 많았음) 저만 알기엔 아까워서 이렇게 번역해서 올려봅니다.

번역된 글을 보려면 여기로 이동해주세용.

혹시나 오역 및 CS 용어에 문제가 있다면 언제든 알려주시면 감사하겠습니다.

8

개인홈피에 새포스트 올리려고 localhost에서 테스트 하고 있었는데 분명 파일이 있는데 자꾸 없다고 해서 않이 외 안되 하고 있었는데 cache 쌓인 거 때문에 그런 거였음...그래서 cache 지우고 다시 키니깐 된다. 역시 컴퓨터 껐다 켰나요 혹은 다 지우고 다시 깔아봤나요가 최고다.

1
0

개인적으로 뭐 번역할 때 시간 많으면 어지간하면 초벌번역은 내가 다 하는데 그렇게 해놓고서 LLM한테 해달라고 하면 얘가 너무 잘해서 자존심 좀 상할 때가 있다. 그럼 쓰잘데기없이(??) 독기랑 경쟁심 생겨서 더 열심히 초벌 번역하게 되는데, 그러다가 내가 지금 기계랑 자존심 싸움하는 것 같아서 현타올 때가 가끔 있다. 물론 아뎁투스 메카니쿠스의 테크 프리스트에 빙의해서 기계신의 가호를 요청할 때도 있긴 함.

1

오이카페에 초대제 커뮤니티 기능이 추가되었습니다! 기존에는 링크를 알면 참여할 수 있는 커뮤니티 기능이 있었는데, 초대제 커뮤니티는 명시적으로 초대를 받아야 커뮤니티를 열람하고 커뮤니티에서 활동할 수 있습니다. 많관부! oeee.cafe

1
4
5
0
1

잠깐 동안 기가 팍 죽었지만 그럼에도 불구하고!!! 여러가지 피드백을 받을 수 있어서 좋았고 내 스스로에게도 줄 수 있어서 좋았고 무엇보다 내가 딩코 실력이 지금 어느 정도인지(=처참한지) 알 수 있어서 무엇을 더 공부해야하고 연습해야하며 습관화 해야할지 머릿속에 명확하게 딱 떠올라서 굉장히 유용했음!!

1
6

와우 코딩테스트 mock interview 했는데 개털림 ㅋㅋㅋ 심지어 풀었던 건데 못 풀고 난리도 아니었음...1) 누군가 내가 코드하는 걸 보고 있다 2) 그 코드하는 걸 내가 설명해야한다 3) 시간 제한이 있다 4) 여러가지 티키타카하면서 주고 받아야한다 이 4가지가 한꺼번에 팍 오니깐 와우 가장 기본적인 것들도 어버버버 하고 패닉와서 나 왤케 멍청하지 하면서 그냥 별 생각없이 풀 때랑은 차원이 다르다는 걸 깨달았습니다..

3

자기 전에 What every programmer should know about memory 읽고 잘까 싶었는데 길어봐야 20쪽 좀 안되는 평범한 CS 페이퍼인줄 알았다가 two-column layout에 appendix 포함해서 100쪽이 넘는다는 걸 알고선 그냥 이부자리 폈음...DB 책 지금 읽는 거 다 읽으면 봐야겠다

1

리트코드 1주 할당치 다 풀었다...내일부터 또 1주 할당치 풀어야함..역시 나같은 닝겐은 데드라인이 있어야 일을 한다..다 풀고 나면 문제를 더 풀기보단 그 동안 풀었던 거 쭉 다시 보시면서 제대로 내 걸로 만들어야지.

1
2

Ok? I did a lot haha. Ive been focusing on this Sep and last days of Oct, as a consequence, the midterm and lots assignments await me?

5
0

리트코드 문제들 풀고 좀 쉬다가 갑자기 일본어에서 어떤 동사일 때 목적어에 を가 아니라 が를 붙이는지 꽂혀서 일본 언어학계에서 고전으로 취급받는 문법서[1] 좀 보다가, 다시 리트코드 풀려고 하니깐 배고파서 머리가 안 돌아가네...라고 생각한 순간 점심 타임인 걸 깨달았다. 뭐 먹지?


  1. 학교 국어/영어 시간에서 보는 문법책이랑은 다르다. 그런 문법은 보통 규정문법(prescriptive grammar)이라고 하고, 언어학에서는 어떤 언어가 보이는 임의의 현상들을 이론적으로 기술한다는 점에서 기술문법(descriptive grammar)이라고 함. ↩︎

1
1
2
4

연휴이후 첫 출근, 한글이름 정렬이 안된다는 오류를 받아서, order by name 을 빼먹었을 리 없다고 생각하면서, 오류를 추적했는데,

  • 코드는 당연히 order by 가 적용되어 있었고,

결과적으로 문제는 PostgreSQL에서 한글 ORDER BY 정렬 문제 해결하기 COLLATE 이슈와 동일한 현상이었다.

(내부 docker postgre:17.4 와 AWS RDS PostgreSQL 17.2 모두) 기본값 en_US.UTF-8 이 적용되어 있었고, 한글 정렬순서가 올바르게 나오지 않았다.

SELECT datname, datcollate, datctype
FROM pg_database
WHERE datname = current_database();
|datname |datcollate |datctype   |
|--------|-----------|-----------|
|postgres|en_US.UTF-8|en_US.UTF-8|

ko_KR.UTF-8 로 새 로케일 지정해서 데이터베이스 새로 만들고, 덤프 백업 & 복원처리를 진행해서 해결은 완료했는데, 간단하게 COLLATE "C" 로도 한글정렬문제를 해결 할 수 있겠다 싶었는데, ChatGPT와 이것저것 논의해본 결과(?) 문자코드순 정렬이라서 사전식 정렬과는 다소 차이가 있어서 완전한 해결책은 아닌 듯 싶다. (비슷하게나마 해결은 되지만)

데이터베이스를 새롭게 만드는 게 어려우면, 특정 컬럼에만 COLLATE 를 지정해서 변경할 수 있다.

ALTER TABLE 테이블명
ALTER COLUMN 컬럼명 TYPE 데이터타입 COLLATE "C";

서비스가 아직 한국어와 영어만 지원해서, 별다른 고민없이 ko_KR.UTF-8로 처리하기는 했는데, 일본어나 중국어까지 지원하면 결국 Collation을 C 로 해야하는 것은 아닌가 싶은 생각도 들고, ko_KR.UTF-8에서 일본어,중국어도 다 잘 정렬되지 않을까 싶은 생각도 들고, 혹은 정렬이 중요한 포인트라면 언어별로 컬럼을 파야할 것인가 하는 고민은 있는데, 일단은(?) 나중에 다시 고민하기로 했다.

7
7

Core function은 tinyld 라이브러리에서 나오는 것 같은데 소스코드 보니깐 엔그램 썼구나...! 그래 맞아 길어봐야 몇 문장일 거고 사실 최초 몇 단어 혹은 몇 자, 그리고 어떤 문자인지에 따라 (CJKV 같은 계열엔 더욱 더 명확할 거임) 바로바로 detection 하면 되는 걸테니 굳이 복잡시리한 거 안 써도 됨...내 최애 언어모델 엔그램 🥹 (다른 건 LSTM 🥹)

4

11월 중순~11월 말 사이에 해커스펍 오프라인 밋업 Hackers' Public 두번째 모임을 진행하려고 하는데 "눈물없이 듣기 어려운 프론트엔드의 심연" 특집입니다...... 11월 1일~11월 8일 사이에 모집 공고 올릴듯????? 아직은 오피셜한 공지는 아니지만 정보만 슬쩍 흘려봅니다,,,

9

해커스펍을 쓰고 있으면서도 정작 연합우주랑 액티비티펍 프로토콜에 대해선 큰 그림조차 사실 감이 잘 안 왔는데(...) 워드프레스에서 작년에 연합우주랑 액티비티펍 관련해서 영상들을 몇 개 올려서 보고 있는데 한방에 팍 이해가 되어서 재밌게 보고 있다. 액티비티펍 공동창시자인 Evan Prodromou랑 찍은 것도 있는데 왜 액티비티펍을 만들었는지에 대한 동기도 설명해줘서 좋았음..

2
3
1

YTN에서 편두통의 심각성에 대해 기사로 다뤄주시면서 인터뷰에 나오게 되었습니다. 편두통은 단순히 개인을 넘어 사회 전체에 큰 부담을 가져오는 질병입니다. 환자들이 적절한 진단을 받고 필요한 치료를 빠르게 받을 수 있는 환경이 마련되는 것이 환자 개인에게도, 주변 사람들에게도, 우리 사회 전체에 큰 이익을 가져옵니다.

기사에서는 편두통에 심각성을 주로 다뤄주셨는데 저는 잘 치료 받으면서 잘 관리하고 있습니다! 편두통은 전문 치료제를 받아서 전조가 오거나 통증이 시작될 때 빠르게 약을 먹으면 효과가 좋은 편입니다.

https://www.ytn.co.kr/_ln/0134_202510111313538858

노트북 스티커로 같이 나온 펍냥이
11
0
0

작업일지 251012

이번에는 Announce 액티비티 지원하는 작업을 진행 중인데, 해커스펍이 어떻게 구현되어 있는지 하나하나 뜯어보면서 작업 중이다. 고려해야 할 사항이 몇 가지 있는데... 당장은 쉬운 것 순서대로 작업할 것들을 정리하고 있다.

  • Phase 1 : 내가 팔로하고 있는 원격 계정에서 전달되는 Announce 액티비티를 인박스에서 수신하는 과정을 핸들링한다. (원격에서는 followers에 cc 걸어서 Announce 액티비티를 전송하기 때문)
  • Phase 2 : 나를 팔로하고 있는 로컬 인스턴스 계정의 글을 재공유하는 매커니즘을 구현한다.
  • Phase 3 : 나를 팔로하고 있는 원격 계정의 inbox에 Announce 액티비티를 전달하는 매커니즘을 구현한다.

지금은 Phase 1에 신경쓰고 있는 상황. 허나, Phase 1을 작업하고 있는 과정에서 병목이 생겼다. 다행히 해결했다만.

Follow 액티비티가 언제부턴가 전송이 안되고 있어서 왜 그런가 했는데, 프로덕션 배포하는 과정에서 federation 옵션을 바꾼게 화근이 되었음. 백엔드와 프론트엔드가 하나로 합쳐져있을때는 origin 옵션에 URL 하나만 걸어두면 그만인데, 백엔드/프론트엔드 나눠놓은 상황에서는 프론트전용 URL(webOrigin)/백엔드전용 도메인(handleHost) 각각 분리를 해야했음. 그와 관련된 패치를 어제 했었던 것으로 기억한다.

변경사항이 있었다는걸 까먹은 상태에서, 로컬환경에서 원격 인스턴스에 Follow 액티비티가 왜 Unauthorized 에러가 뜨면서 전송이 되지 않았나했는데... 역시 이런 맥락이 있었던 것. 즉, handleHost(백엔드쪽 도메인)은 Tailscale에서 생성한 URL로 들어가는 반면, webOrigin은 localhost로 설정이 되어 있었기 때문에 서명하는 과정에서 오류가 발생한 것임. NODE_ENV 환경변수가 development 인 경우에만 webOrigin/handleHost를 같은값을 쓰는 걸로 임시방편으로 처리함. 관련 코드

4

Apache Sedona DB - Geospatial을 지원하는 싱글노드 분석형 DB 엔진
------------------------------
- *지리공간(geospatial) 처리* 를 핵심으로 설계해 *벡터·래스터 연산* 과 *공간 최적화* 를 내장한 *단일 노드 분석형 DB 엔진* 오픈소스
- 목표는 *가장 빠른 공간 분석 쿼리 속도* 와 *폭넓은 함수 커버리지* 제공
- 로컬 머신이나 단일 클라우드 인스턴스에서 *소·중형 데이터셋* 처리를 지향하고, …
------------------------------
https://news.hada.io/topic?id=23594&utm_source=googlechat&utm_medium=bot&utm_campaign=1834

0

오는 11() 8() 光云大學校(광운대학교)에서 開催(개최)되는 FOSS for All 컨퍼런스 2025에서 제가 〈야크 셰이빙: 새로운 오픈 소스의 原動力(원동력)〉이라는 主題(주제)基調演說(기조연설)을 하게 되었습니다!

올해 처음 열리는 FOSS for All 컨퍼런스는 “Free and Open Source Software for All”이라는 슬로건 아래, 모두를 ()한 오픈 소스 컨퍼런스를 目標(목표)로 하는 非營利(비영리) 오픈 소스 커뮤니티 컨퍼런스입니다.

파란色 背景의 FOSS for All 컨퍼런스 2025 發表者 카드. 右側 아래에는 發表者 洪民憙의 寫眞이 있고, 中央의 흰色 말風船 안에는 「Keynote」라는 文句와 함께 發表 題目 〈야크 셰이빙: 새로운 오픈 소스의 原動力〉이 쓰여 있다.
15
0
0

구슬아이스크림 shared the below article:

함수형 언어의 평가와 선택

Ailrun (UTC-5/-4) @ailrun@hackers.pub

이 글은 함수형 언어의 핵심 개념을 람다 대수를 통해 소개하며, 함수형 언어의 평가 방식에 대한 깊이 있는 이해를 제공합니다. 람다 대수의 기본 요소인 변수, 함수, 함수 호출을 설명하고, 값에 의한 호출(CBV)과 이름에 의한 호출(CBN)의 차이점을 명확히 분석합니다. 특히, 폴 블레인 레비의 "값 밀기에 의한 호출(CBPV)"을 소개하며, 이 방식이 CBV와 CBN을 모두 포괄할 수 있는 강력한 도구임을 강조합니다. CBPV가 함수와 함수 호출을 스택 기반으로 어떻게 다르게 해석하는지, 그리고 이를 통해 람다 대수를 기계 수준으로 컴파일할 때 얻을 수 있는 이점을 설명합니다. 항수 분석과 같은 최적화 기법을 CBPV를 통해 어떻게 더 명확하게 표현할 수 있는지 보여주며, GHC 컴파일러의 중간 언어로서 CBPV의 중요성을 부각합니다. 이 글은 함수형 언어의 깊은 이론적 배경과 실제 컴파일러 구현 사이의 연결고리를 탐구하고자 하는 독자에게 유용한 통찰력을 제공합니다.

Read more →
15
3
0
2

일본어 과외 받은지 한 세 달? 정도 되어가는데 아직 많이 부족하지만 그래도 흥미는 잃지 않고 계속 배우고 있다. 처음 배웠을 때보다 엄청 많이 늘었고. 선생님이 한일 혼혈분이셔서 한국어도 잘 하고 일본어도 잘 하셔서 회화 중심으로 해서 잘 배우고 있음. 일주일에 한 번은 일본 사는 지인이랑 언어교환도 하고...흔히들 한국어랑 일본어가 비슷하다고 하는데 언어학 관점에서 보면 일본어는 한국어에 비하면 비단 경어에서뿐만 아니라 전체적으로 문법체계가 굉장히 엄격한 느낌이다...그나저나 지인분도 그렇고 선생님도 그렇고 일본 와서/가서 일해보는 거 어떠냐고 종종 꼬시는데(?) 생각을 안 해 본 건 아니어서 좀 고민 중이다. 하지만 난 아직 실무 경험이 없는 걸...가방끈만 애매하게 김..흑

1