너 왜 갑자기 쓰잘데없이 감성 있는 척 하는 거지? 나 쑥스럽게 만들지 마
구슬아이스크림
@icecream_mable@hackers.pub · 61 following · 45 followers
인간의 언어처리와 LLM의 언어처리를 서로 비교하는 전산심리언어학(Computational Psycholinguistics)을 연구했'었'습니다.
하지만 CS덕질이 더 재밌다는 걸 깨닫고선 대학원을 탈출했습니다.
요즘은 데이터 엔지니어링과 컴파일러가 재밌어요.
Github
- @kihyo-park
Blog
- kihyo-park.github.io
Linkedin
- kihyo-park
오타쿠 밴드 하는 거 뭔가 이것저것 실무적인 것들이 생겨나고 있는데 (로고, 합주/공연 일정, 합주곡, 합주영상 등등) 구글 드라이브에 넣으니깐 정리도 잘 안되고 그래서 우리만 쓰는 작은 웹사이트같은 거나 하나 만들까 생각 중인데 어디서부터 시작해야하지...?
오랜만에 SQL 쿼리 짜니깐 짱 재밌어
나도 컴파일러 엔지니어 하고 싶어
예전에 참여했던 NLP 관련 프로젝트 중에 하나가 한국어에 특화된 연구였는데 1저자분께서 고군분투 하신 끝에 2번인가 리젝 먹고 억셉 받았지만 그 때 받았던 리뷰 중 하나가 왜 한국어 특화된 연구를 하느냐란 어투가 물씬 느껴지는 코멘트였는데 (대놓고 말하진 않았음) 보면서 진짜 전형적인 영어 중심적인 생각이 느껴져서 속으로 좀 기분이 그랬던 적이 있었음...물론 궁극적으론 특정 언어에 구애받지 않는 language agnostic한 걸 추구하는 거겠지만 그러기 위해선 language specific한 연구와 데이터 또한 구축하는 것 또한 이루어져야 하는 거 아닌가 하는 생각임..적어도 원론적으론.
오이카페 iOS/Android 테스트 버전이 출시되었습니다. 누구나 베타에 참여할 수 있어요. 다음 링크에서 다운로드 가능합니다!
iOS: https://testflight.apple.com/join/ZYS7gR8r
Android: https://play.google.com/apps/testing/cafe.oeee
Writing software is an act of learning. Don’t automate it.
Link: https://martinfowler.com/articles/llm-learning-loop.html
Discussion: https://news.ycombinator.com/item?id=45841056
구슬아이스크림 shared the below article:
컴퓨터공학에서 사용하는 회귀(Regression, 回歸) 라는 용어에 대해
JakeSeo @jakeseo@hackers.pub
이 글은 컴퓨터 공학에서 '회귀(Regression)'라는 용어가 사용되는 두 가지 주요 맥락, 즉 머신러닝과 소프트웨어 테스팅에서의 의미를 명확히 구분하여 설명합니다. 머신러닝에서는 변수 간의 관계를 모델링하여 값을 예측하는 기법을 의미하며, 그 기원과 함께 집값 예측 예시를 들어 이해를 돕습니다. 반면 소프트웨어 테스팅에서는 과거의 버그가 재발하는 현상을 검증하는 과정을 지칭하며, 개발이 '뒤로 회귀했다'는 표현으로 설명합니다. 이 글을 통해 독자는 회귀라는 용어가 가진 다의성을 이해하고, 각 분야에서 어떻게 활용되는지 명확히 파악할 수 있습니다.
Read more →오늘은 일본어 수업도 듣고 분할정복 알고리즘도 다시 제대로 보고 SQL 쿼리들도 다시 감 좀 찾고 기타로 곡도 하나 악보 채보도 하고 알찼다
오 쉣 맨날 파이썬만 하다보니깐 SQL 쿼리 구문 다 까먹음 담주부터 스터디 하는데 다시 복구 시켜야함
좀 하찮은 것처럼 보일 수도 있는데 배열에 미리 값들을 0이나 Null 같은 걸로 미리 채워놓는 initialization 단계는 뭐랄까 나한텐 되게 항상 신선하게 다가온다. 보통 사람들은 이미 자신이 원하는 특정 값들이 채워진 채로 논리를 시작하는 것 같은데 (반박시 여러분 말이 맞음) 딩코에서는 빈칸이라는 개념을 저렇게 시작하는 게 되게 신기하게 느껴짐...나만 그런가? 아마 나만 그런 거겠지?
I want a good parallel language [video]
Link: https://www.youtube.com/watch?v=0-eViUyPwso
Discussion: https://news.ycombinator.com/item?id=45807993
오늘은 Maximum subarray problem 관련해서 그 동안 나왔던 풀이들 다 구현하는 거 덕질하는 걸로 하루를 보내야징
알바 지원했는데 막 인터뷰를 AI가 진행해주는 거임 근데 AI가 살짝 헛소리 해서 오 이게 바로 싸-이버펑크인가 하면서 인터뷰했음
깃헙 레포 커밋 히스토리 좀 보다가 깃헙에선 레포를 다운받지 않는 이상, 최초 커밋부터 최근까지 브라우징 해주는 건 좀 귀찮게 해야한다는 걸 알고선 어제 오늘 해서 틈틈히 짬내서 로컬에서 깃헙 API의 list commit 끌어다가 pagination해서 일단은 기존 깃헙처럼 가장 최근 것부터 최초 커밋까지 쭉 브라우징 해주는 거 날먹으로(?) 구현해봤는데, 5000여개 남짓 커밋들로 이루어진 레포만 해도 다 불러내는데 1분 가까이 걸려가지구 아..좀 큰 레포 갖고 하려면 API rate limit 터지고 불러오는데 몇 시간 걸리는 건 예삿일도 없겠구나 싶었다란 생각이 들었다. 그래도 오랜만에 scratch your own itch 해주는 거 만들어서 좋았고 생각보다 배운 것도 꽤 많아서 재밌었당.
구슬아이스크림 shared the below article:
브라우저 스터디 기록 (2)
Jaeyeol Lee @kodingwarrior@hackers.pub
이 글은 Web Browser Engineering을 독학하며 겪은 경험을 담고 있으며, 특히 Chapter 2의 연습문제 풀이에 대한 내용을 다룬다. Chapter 2는 브라우저 주소창에 입력을 감지하는 과정부터 HTML을 화면에 렌더링하는 과정을 개괄적으로 설명한다. 마우스나 키보드 입력이 CPU를 통해 커널에 인터럽트 요청으로 전달되고, 브라우저가 이를 처리하여 서버와 통신하며, 최종적으로 그래픽 시스템을 통해 화면에 표시되는 과정을 요약한다. 이벤트 루프의 역할이 중요하지만, 챕터에서는 텍스트를 화면에 출력하는 수준으로 다룬다. 연습문제 중 Emoji 지원과 RTL(Right-to-Left) 지원에 대한 해결 방법이 제시된다. 특히 RTL 지원을 위해, 저자는 텍스트를 한 줄 단위로 묶어 GUI 툴킷이 RTL 순서를 처리하도록 하고, 라인의 시작점을 계산하여 화면 오른쪽에 맞춰 출력하는 방법을 사용했다. Emoji의 경우, 좌표를 미리 지정하여 텍스트 라인과 분리하여 처리함으로써 문제를 해결했다. 이 글은 브라우저 엔진의 기본적인 동작 원리를 이해하고, 실제 구현 과정에서 마주칠 수 있는 문제에 대한 해결책을 제시하여 독자에게 실질적인 도움을 줄 수 있다.
Read more →대용량 트래픽 처리를 어떻게 경험하냐 물어보는데 사실 이정도만 해도 됨.
1. 큐 시스템 지연을 해결해본 경험 (예: 8시간까지 큐 지연이 있는걸 확인했고 이걸 구조 변경을 통해 해결한 경험)
2. 정적 데이터 요청은 최대한 근원 프로세스까지 도달하지 않게 캐시하여 네트워크 전송 비용 절감 및 응답속도 향상 경험
3. 불특정 다수가 참여하는 텍스트 메시징 서비스에 동영상이 포함되는 경우, 온전하게 동영상 처리하면서도 메시지 교환을 지연시키지 않는 경험
4. 새해 등 기념일에 늘어나는 메시지로 인해 다른 서버가 터져도 내 서버만은 비용 상승이나 큐 지연 없이 서비스 제공해본 경험.
이정도만 모의로 집에서 해보길 강추드림.
제가 집필한 책이 출간되어 소개해봅니다. 현재 예약판매 상태예요. Python과 FastAPI 기술스택을 다루는 내용인데, 주제이자 핵심 내용은 서비스를 개발해 출시하여 운영하는 데 초점을 맞추었어요. 출시해 운영하는 데 학습하고 다루기 좋은 도구가 Python과 FastAPI여서 이 두 도구를 다루는 거지요. Python, FastAPI은 Back-end Application Server 개발에 많이 사용되고 있는데, 특히 데이터 처리와 AI 개발을 하는 분들도 교양처럼 학습하고 다루어서 빠르게 저변을 넓혀가고 있습니다.
교보문고 https://gilbut.co/c/25109056bV 예스24 https://gilbut.co/c/25103487Bh 알라딘 https://gilbut.co/c/25106075TC
FastAPI를 이용해 서비스 개발부터 출시까지 더 쉽고 효율적으로 학습하고 경험한다!
서비스를 기획하고 만드는 것도 쉽지 않지만, 실제로 세상에 출시하고 운영하는 일은 그보다 더 많은 시행착오와 노하우를 요구한다. 로컬 호스트에서 구동하는 과정에서는 드러나지 않던 문제들이 출시하는 과정에서 드러나기도 하고, 그에 따라 장애와 복잡도도 함께 늘어난다. 그래서 이 책은 웹 애플리케이션 서버를 구현하는 데 그치지 않고, 실제 서비스를 출시하는 과정까지 함께 다룬다. 이때 사용하는 도구가 너무 어렵거나 복잡하면 끝까지 완주하기 어려운데, 그 점에서 FastAPI는 배우기 쉽고 빠르게 결과를 확인할 수 있어 실전 프로젝트를 경험하기에 적합하다.
이 책은 약속 잡기 웹 서비스를 하나의 프로젝트로 삼아, 기획부터 구현, 배포까지의 모든 흐름을 따라간다. 1~6장에서는 요구 사항 정의, 설계, 환경 구성 등 개발에 필요한 기반을 다지고, 7~12장에서는 본격적인 기능 구현과 프런트엔드 및 외부 서비스(구글 캘린더)와의 연동을 다룬다. 13~14장에서는 깃허브와 AWS를 활용한 배포와 운영 방법을 살펴본다. 전체 과정에서 테스트 주도 개발(TDD)과 애자일 개발 방식의 일부 요소를 적용해 실제 개발 현장에 가까운 흐름을 따라가며, 각 기능이 끝날 때마다 테스트를 통해 완성도를 높여간다. 이 책 한 권으로, FastAPI를 이용한 웹 서비스 개발과 출시 전 과정을 실습 중심으로 온전히 체험할 수 있다.
API 뜯어 보는 게 꿀잼임
최근 몇 주 동안 딩코하는데 현타가 와서 사실 IDE 조차도 안 키고 딩코를 거의 안 했는데, 포스트 쓰니깐 다시 하고 싶은 마음이 든다. 사실 아직도 나한텐 딩코가 어렵고 버겹게 느껴진다. 특히 리트코드 풀고 있으면 더 그럼...쉬운 것부터 하고 그냥 자기가 평소에 불편해했던 걸 간단하게 프로그램으로 짜라고 하던데 그것마저도 부담스럽게 다가올 때도 많음. 머리에 든 것만 많아져서 눈 딱 감고 그냥 덤벼야하는데 자꾸 준비에 준비에 준비라는 회오리에 빠질 때가 잦음. learning by doing이라던데 난 endless preparing for doing임 ㅋㅋㅋ 그래도 다시 딩코 하고 싶어져서 좋다. 뭔가를 만들고 싶어...!
자연어에서의 재귀와 카탈랑 수
구슬아이스크림 @icecream_mable@hackers.pub
이 글은 자료구조와 알고리즘에서 중요한 개념인 재귀가 자연어에서 어떻게 나타나는지, 특히 통사론적 관점에서 인간 언어 능력의 창조성을 보여주는지를 탐구합니다. 'X의 Y의 Z의...'와 같은 소유격 조사를 사용한 문장 확장을 통해 재귀의 개념을 설명하고, 이러한 재귀가 카탈랑 수와 연관되어 있음을 지적합니다. 영어 예시를 통해 전치사구의 추가가 문장의 중의성을 증가시키고, 구문 분석의 가능한 경우의 수가 카탈랑 수열을 따른다는 것을 보여줍니다. 생성 규칙을 통해 명사구를 재귀적으로 확장하면서 중의성 계수가 카탈랑 수와 동일하게 나타남을 설명합니다. 마지막으로, 자연어의 중의성 해소는 산술 표현식과 달리 확률에 의존하며, 이는 전산/심리언어학에서 중요한 연구 주제임을 강조합니다. 이 글은 재귀의 개념이 자연어에서 어떻게 복잡하게 작용하는지, 그리고 그 중의성을 이해하는 것이 왜 중요한지를 흥미롭게 제시합니다.
Read more →🥒📲 오이카페가 드디어 앱으로 출시됩니다. 앱이 성공적으로 출시될 수 있도록 도와주세요. 모바일 앱 베타 테스트 신청서를 받고 있습니다. 부스트 해주시면 감사합니다! 많관부! https://forms.gle/bm72C1dm8hviUSN36
세상에 이게 개봉하다니!!! 진짜 이거 꼭 봐야함 2000년대 초반 그 시절 일본 극장판 애니 작화 끝판왕 중에 하나임!!! 꼭 봐야해!!!
EuroLLM: 유럽에서 개발된, EU 24개 공식 언어를 지원하는 LLM
------------------------------
- EuroLLM 은 유럽 내 연구기관이 공동 개발한 *24개 공식 EU 언어 지원 대형언어모델(LLM)* 로, 유럽의 *AI 주권과 기술 자립* 을 목표로 함
- *9B 파라미터 모델* 로, 35개 언어에서 *4조 개 이상의 토큰* 으로 학습되어 *질문응답, 요약, 번역 등 언어 과제에 강점* 을 보임
- EuroLLM 9B Base 는 파…
------------------------------
https://news.hada.io/topic?id=23986&utm_source=googlechat&utm_medium=bot&utm_campaign=1834
존 카맥, 리누스 토르발스 등등 90년대 시절 프로그래머들이 살아있는 전설급 프로그래머로 여겨지는 이유를 썰 풀듯 드립치며 얘기하는 영상. 이유는 간단하게 말하면 오늘과는 다르게 그 시절엔 하드웨어 메모리를 어떻게든 쥐어짜서 로직을 짜야했고, pip install이나 클로드나 제미나이같은 것도 없었고 튜토리얼 지옥에 빠질 일도 없었고 대신 컴파일러 지옥에서 살았기에 가능했다는 얘기. 물론 그들이 선구자였기에 그 버프를 받아서 전설급이 되었을 거란 얘기도 있다. 보면서 그 때는 정보가 적었기에 폐관수련이 필수였는데 오늘날엔 오히려 정보가 넘쳐나고 풍부해서 그게 좀 덜 하는 걸까 싶기도 했다.
@icecream_mable구슬아이스크림 감사합니다...!! 혹시 가까운 분들께서 골라 가지신 이후에 남는 게 있을지 다시 여쭤 보러 오겠습니다. 실례했습니다!
@eonj어리 아닙니다 ㅎㅎ 그리고 이미 다 갖고 가셔서 이 댓글 보시는대로 원하시는 거 리스트 알려주시면 될 것 같아요.
날 추워지고 그러니깐 집에만 있고 싶고 자꾸 풀어지고 그러는데 나도 튜사 한달권 끊어볼까?
@icecream_mable구슬아이스크림 헉 안녕하세요 혹시 초면에 실례되지만 나눔 신청 가능한가요...
@eonj어리 네! 근데 이미 지인분들께서 꽤 많이 지불하시면서 가져가셔가지고 원하는 게 없으실 수도 있어요. 리스트 남겨주시면 재고 확인해서 답변드릴게요.
집 인터넷이 자정~새벽 1시 사이만 되면 이상하게 버벅대는데 매일 점검하는 건가 싶으면서도 무슨 메가패스 시절도 아니고 요즘같은 시대에도 매일 점검하는 게 로컬에도 영향을 끼칠 정도인가 하는 생각도 들고 하여튼 뭔가 좀 꼬롬함..크게 불만은 없어서 그냥 쓰고 있긴 하지만..ㅎ
악기 연습에 쓰려고 만든, 정해진 코드 진행에서 3도/5도 워킹 라인을 랜덤 생성하는 앱.
from scratch에서 2시간 가량 써서 만들었습니다.
프런트엔드는 잘 몰라서 그냥 tailwind 쓰고 카드 나열했네요 😅
집에 언어학 책들이 너무 많고 앞으로 볼 일이 없을 것 같아 책장 정리도 할 겸 처분 중이다...물론 이 중에 제대로 완독한 건 절반 좀 넘게밖에 없지만 ㅋㅋ
딩코(특히 코테) 잘하고 싶어 흑
구슬아이스크림 shared the below article:
브라우저 스터디 기록 (1)
Jaeyeol Lee @kodingwarrior@hackers.pub
이 글은 Web Browser Engineering 교재를 독학하며 연습문제를 풀이하는 과정을 담고 있습니다. 저자는 추상화 수준에 대한 고민을 드러내며, URL 클래스의 request 메서드 대신 Connection 클래스를 도입하여 소켓 관리를 더 자연스럽게 처리했습니다. 또한, 타입 힌트 적용과 pytest를 이용한 유닛 테스트 환경 구축 등 실습 환경을 풍성하게 구성하는 데 LLM의 도움을 받아 효율성을 높였습니다. 연습문제 풀이에서는 keep-alive 지원의 중요성을 강조하며, TCP handshake 비용 절감 여부를 직접 실험해볼 것을 권장합니다. 리다이렉션 문제에서는 Location 헤더의 다양한 케이스 처리와 최대 리다이렉션 횟수 제한을 고려해야 함을 지적합니다. 캐싱 문제에서는 Cache-Control 헤더의 다양한 옵션에 대한 처리 방법을 제시하고, 압축 문제에서는 Transfer-Encoding: chunked 헤더 처리의 중요성을 강조합니다. 전반적으로 이 글은 단순한 문제 풀이를 넘어, 브라우저 엔진의 동작 원리를 깊이 이해하고 실제 코드에 적용하는 과정을 보여줍니다. 독자들은 이 글을 통해 연습문제 풀이에 대한 힌트를 얻을 뿐만 아니라, 브라우저 개발에 대한 실질적인 인사이트를 얻을 수 있을 것입니다.
Read more →Vibe Coding in the 90s
Link: https://ssg.dev/vibe-coding-in-the-90s/
Discussion: https://news.ycombinator.com/item?id=45700266
구슬아이스크림 shared the below article:
"expression"은 "표현식"이 아니라 그냥 "식"
蛇崩 (じゃくずれ) @ja@hackers.pub
이 글은 프로그래밍 용어 "expression"을 "표현식"이 아닌 간결한 "식"으로 번역해야 한다고 주장합니다. 필자는 "expression"이 수학에서 유래되었으며, 수학에서는 이미 "식"으로 번역되어 사용되고 있음을 지적합니다. 또한, 프로그래머들이 "표현식"을 선호하는 이유로 사전적 정의와 초·중등 교육에서 비롯된 선입견을 들지만, 실제로는 "식"으로 번역해도 의미 전달에 전혀 문제가 없다고 강조합니다. 오히려 "표현식"은 "representation"의 번역어인 "표현"과 혼동될 수 있으며, "정규표현식"과 같이 불필요하게 긴 용어를 만들어낼 수 있다고 비판합니다. 결론적으로, 필자는 "expression"을 "식"으로 번역하는 것이 더 정확하고 간결하며, 전산학 용어의 일관성을 유지하는 데 도움이 된다고 주장하며, "정규식"이라는 간결한 용어 사용을 옹호합니다.
Read more →와 나도 이거 해보고싶다....
리트딩코 및 오타쿠밴드 합주!!!!!!!!!!!!!!!!!!!!!
오픈소스 생태계의 ‘보이지 않는 노동’ — 절반은 기록되지 않는다
------------------------------
## 오픈소스 생태계의 ‘보이지 않는 노동’ — 절반은 기록되지 않는다
*저자:* John Meluso (Cornell Univ.), Amanda Casari & Katie McLaughlin (Google LLC), Milo Z. Trujillo (Northeastern Univ.)
*발행:* 2024년 1월, ACM 논문 사전 공개본
*원문:* [arXiv:2401.06889v2](
------------------------------
https://news.hada.io/topic?id=23856&utm_source=googlechat&utm_medium=bot&utm_campaign=1834
데이터베이스 설계, 이렇게 하면 된다 - 정규화부터 클라우드 대응 설계, ER 다이어그램 작성, 성능 튜닝, 안티패턴 회피, 실무에서 쓸 수 있는 그레이 노하우까지 담은 전문가의 DB 설계 비법서, 제2판 (미크 (지은이), 윤인성 (옮긴이) / 제이펍 / 2025-10-30 / 27,000원) https://feed.kodingwarrior.dev/r/6Cz4QR
https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=375002773&partner=openAPI&start=api
이거 짤방 왜 이렇게 웃김 ㅋㅋㅋㅋ (출처는 여기)
구슬아이스크림 shared the below article:
[잘라먹는 프로그래밍 언어론] 변수가 스스로의 이름을 지키는 법 (de Bruijn index/level)
RanolP @ranolp@hackers.pub
이 글은 프로그램에서 이름 충돌을 피하고 코드를 정확하게 평가하기 위한 방법으로 de Bruijn index를 소개한다. 변수 이름으로 인한 혼란을 해결하기 위해 α-변환을 설명하고, de Bruijn level과 index를 통해 변수를 숫자로 표현하는 방법을 제시한다. 특히, de Bruijn index는 변수가 얼마나 바깥 스코프를 참조하는지 나타내어, 형식적 증명에서 이름 없는 변수들을 다루는 데 유용함을 강조한다. 이를 통해 코드의 본질을 명확히 하고, 형식적 증명 과정에서 동일한 것을 쉽게 식별할 수 있게 된다.
Read more →
구슬아이스크림 shared the below article:
나만의 연합우주 마이크로블로그 만들기
洪 民憙 (Hong Minhee) @hongminhee@hackers.pub
이 튜토리얼은 Fedify를 사용하여 ActivityPub 프로토콜을 구현하는 마이크로블로그를 만드는 과정을 안내합니다. Fedify는 연합 서버 앱 개발의 복잡성을 줄이고, 개발자가 비즈니스 로직에 집중할 수 있도록 돕는 TypeScript 라이브러리입니다. 튜토리얼에서는 Node.js, npm, Hono 등의 개발 환경을 설정하고, SQLite 데이터베이스를 구축하여 계정 생성, 프로필 페이지, 액터 구현, 암호 키 관리, 팔로우 기능, 게시물 작성 및 타임라인 구현 등 마이크로블로그의 핵심 기능을 단계별로 구현합니다. 특히 ActivityPub.Academy 서버를 활용하여 실제 연합우주 환경에서의 연동을 테스트하고, Mastodon과의 호환성을 확인합니다. 마지막으로, 보안 및 기능 개선을 위한 추가 과제를 제시하며, 독자가 프로젝트를 확장할 수 있도록 안내합니다. 이 튜토리얼을 통해 독자는 Fedify를 활용하여 ActivityPub 기반의 분산 소셜 네트워크 서비스를 구축하는 기본적인 이해를 얻을 수 있습니다.
Read more →내 거 블로그 연합우주에 연동되게 해야겠다. astro 기반인데 (정확히는 astro-erudite) 잘 할 수 있을까? 사실 astro가 뭔지도 잘 감이 안 오고 프론트엔드는 해본 적도 없음(백엔드도 마찬가지)...ㅋㅋㅋ 어디서부터 시작해야할지 모르겠지만 일단 astro 문서부터 쭉 덕질해야할 듯...그 다음엔 뭐 어떻게 해야하는 걸까..?
이번엔 제발 되어라
@kodingwarriorJaeyeol Lee (a.k.a. kodingwarrior)
기계신의 축복과 가호가 함께하시기를 바랍니다

















