C#으로 RAG를 구현하려고 할 때 어려울 수 있는 문제점 중 하나인 RAG를 위한 인터넷 페이지 본문 추출을 추가적인 파이썬 프레임워크나 AI의 도움 없이, ReverseMarkdown과 SmartReader로 간편하게 해낼 수 있습니다.
악하
@akastoot@hackers.pub · 133 following · 101 followers
설계 능력 없고 코딩 AI보다 못하고 뭔가 이상한 걸 만들고 있고 (#레퍼럴프로젝트, http://referral.akaiaoon.dev) 매일 커피나 마시는 이제 직장이 없는 SE
GitHub
- @IAOON
Referral Project
- referral.akaiaoon.dev
강한 학생이라고 써야하는데 순간 강한육군이라 쓸 뻔
도커헙 다운되어서 일을 몬하네 퇴근해야겠네
아~ 회사를 위해서 일하고 싶었는데 미치겠다~ 
AWS 죽어서 오늘 교육 조교 일생일대의 위기 겪은 듯
커서 에러 -> storybook 에러 나서 yarn install 안됨 -> 어 aws 죽었네 집에 가자
나 오늘 듀오링고 아직 못했는데
과목에서 좋은 성적 받기: Andrej Karpathy의 성공을 위한 조언
------------------------------
- Andrej Karpathy가 대학생들에게 보내는 학업 성공 조언 정리
- *충분한 수면* 과 *철저한 사전 준비* 가 학업 성취에 핵심임
- 시험 공부 시 *기출문제 분석* 과 *체계적 계획 세우기* 가 중요함
- 공부는 초기 혼자, 마지막엔 *동료와 협업* , 그리고 개념을 *직접 설명* 하며 이해도를 높임
- 시험…
------------------------------
https://news.hada.io/topic?id=23771&utm_source=googlechat&utm_medium=bot&utm_campaign=1834
밤에 심심하면 이 좁은 데서 보란듯이 이리 뒤집었다 저리 뒤집었다 하며 어필을... 이러다 안 알아주면 일어나서 내앞을 가로막고 키보드를 밟는다. 😅
나는 시방 한 마리 맹수여. (병원 다녀옴)
발표자료 다 만들었다... 미리 해놓으니 좀 편하군..
RE: https://mastodon.social/@tootapp/115399857014625427
Despite not using much as my main app,
@tootappToot!.app ↙︎↙︎↙︎ has always stood out to me like nothing else 🙇♂️
Tailscale을 비롯한 Wireshark 기반의 VPN 도구를 이번에 처음 접하게 되면서 "신세계"를 맛보고 있습니다.
저는 다양한 개발 환경을 테스트하고 학습하는 것을 선호하다보니 계속해서 여러 종류의 노트북이나 PC를 구입해서 사용해왔습니다. 그러다보니 관리 문제도 있고, 어딘가로 여행을 가거나 떠나야 할 일이 생기면 어떤 디바이스를 챙겨 가야 하는지가 상당한 고민이 되곤 했습니다.
그렇지만 인터넷만 붙어있으면 어디서든 동일 네트워크 상에 존재하는 것처럼 일관된 환경을 만들 수 있고, 모든 네트워크 송수신 트래픽이 암호화된 상태를 유지하고 있으며, 속도까지 빠르니 더할 나위 없이 좋습니다.
제 경우는 그래서, Surface Pro 8, Surface Laptop 7, GPU 달린 Intel 랩탑, 라즈베리 파이 4, 맥북, 아이폰, 아이패드, Azure VM, WSL 2 환경까지 매우 많은 디바이스와 가상 머신을 전부 단일 네트워크 환경에 붙여서 자유롭게 사용하고 있습니다.
만약 노트북과 데스크톱, NAS 등의 디바이스를 동시에 붙여서 사용해야 하는 것이 고민이라면 Wireshark나 Tailscale을 꼭 살펴보실 것을 권해드리고 싶습니다. 👍
Tailscale을 비롯한 Wireshark 기반의 VPN 도구를 이번에 처음 접하게 되면서 "신세계"를 맛보고 있습니다.
저는 다양한 개발 환경을 테스트하고 학습하는 것을 선호하다보니 계속해서 여러 종류의 노트북이나 PC를 구입해서 사용해왔습니다. 그러다보니 관리 문제도 있고, 어딘가로 여행을 가거나 떠나야 할 일이 생기면 어떤 디바이스를 챙겨 가야 하는지가 상당한 고민이 되곤 했습니다.
그렇지만 인터넷만 붙어있으면 어디서든 동일 네트워크 상에 존재하는 것처럼 일관된 환경을 만들 수 있고, 모든 네트워크 송수신 트래픽이 암호화된 상태를 유지하고 있으며, 속도까지 빠르니 더할 나위 없이 좋습니다.
제 경우는 그래서, Surface Pro 8, Surface Laptop 7, GPU 달린 Intel 랩탑, 라즈베리 파이 4, 맥북, 아이폰, 아이패드, Azure VM, WSL 2 환경까지 매우 많은 디바이스와 가상 머신을 전부 단일 네트워크 환경에 붙여서 자유롭게 사용하고 있습니다.
만약 노트북과 데스크톱, NAS 등의 디바이스를 동시에 붙여서 사용해야 하는 것이 고민이라면 Wireshark나 Tailscale을 꼭 살펴보실 것을 권해드리고 싶습니다. 👍
Wireguard라고 해야하는데 잘못 썼습니다 🤣🙏
개발자 모임 가는 게 학회 가는 것보다 더 재밌는 듯 진작에 개발자 할 걸
개발자들이 연합우주에 잘 오지 않는 이유는 연합우주로 취업하기 어렵기 때문이다 연합우주 카르텔을 만들어서 서로 밀고 끌고 해줘야 한다!! (절대 제가 일자리를 알아보고 있어서 하는 말입니다)
읽을책 <HTTP 완벽 가이드> 저자 데이빗 고울리 , 브라이언 토티 , 마조리 세이어 , 세일루 레디 , 안슈 아가왈 (이응준 , 정상일 번역 )
네트워크 | 인사이트 | 756p
제 집필서 표지가 나왔어요. 설레네요. 두근두근.
今回のPC故障に伴って色々ファイル整理してたら出てきた絵
ちょうど去年の今頃だから、VRchat経由で知ったんだと思う
알고리즘(코딩테스트) 재활훈련은 유형별 공부는 일본어 독해 연습 겸 해서 atcoder.jp 요걸로 해볼까 싶고, 실전모의고사? 비슷한건 leetcode.com 으로 할 것 같다.
클로드 일 시키면 지가 쓴 코드에 지혼자 "완벽합니다!" 하고 자화자찬 하는 거 왤케 킹받지
액터/사용자만 나열하는 방식으로 러프하게 어드민 페이지 구현 완료. 배포하면 어떻게 될지 모르겠군.
개인적으로는 어드민 페이지는 아예 별개의 서비스로 분리가 되어있어야 한다고 보는 입장이라, 아예 별개의 패키지로 나눔 @cosmoslide/admin 같은 식으로
클로드로 뭐 좀 물어보려고 텍스트 파일 하나 넣고 돌렸더니 파일 너무 크다고 걍 뱉어버리길래 왤케 찡찡 대나 했더니 PDF 파일로 보니까 132쪽...
ㅈㅅ합니다
Hashnode 게시글을 불러오는 API를 기반으로 자기만의 정적 사이트 생성기 템플릿 굽는 분들이 계시길래, Hackers Pub도 이런게 되어야 하지 않나 싶었다. 실제로 graphql API를 까봤는데, 이론상으로 불가능하지는 않아서 도즈언 했는데 생각보다 잘 나온다..... Astro에다가 Hashnode API 연결한 예시를 베이스로 해서, hackerspub 버전으로 바꿔달라고 claude code한테 프롬프트 넣어줬더니 진짜 그냥 해줌.
Ok? I did a lot haha. Ive been focusing on this Sep and last days of Oct, as a consequence, the midterm and lots assignments await me?
라떼만 해도 Xilinx Vivado였는데 이제 스플래시에 AMD Vivado라고 뜨더라...
I'm giving the keynote at the FOSS for All Conference 2025, but the organizers told me I have to provide my slides in English too, which means I'm now stuck having to explain what the heck Korean mixed script (國漢文混用體) is in English. 😇
✍️ AI와 오픈소스가 글쓰기를 바꿀 수 있을까?
Quarto + Claude·Gemini CLI로 만드는 새로운 저작 워크플로우
📖 AI 글쓰기
👤 이광춘 (한국 R 사용자회)
세션 https://2025.fossforall.org/sessions/
티켓 https://event-us.kr/fossforall/event/110400
HTTP3 Explained
Link: https://http3-explained.haxx.se
Discussion: https://news.ycombinator.com/item?id=45565646
Can't count how many times i shot finger-gun myself 🫶🫶🫶🫶🫶🫶🫶 Thaaanks
소스코드 뜯어보고 그 뒤에 담긴 원리 덕질하는 거가 딩코할 때 제일 재밌어
연휴이후 첫 출근, 한글이름 정렬이 안된다는 오류를 받아서, order by name 을 빼먹었을 리 없다고 생각하면서, 오류를 추적했는데,
- 코드는 당연히
order by가 적용되어 있었고,
결과적으로 문제는 PostgreSQL에서 한글 ORDER BY 정렬 문제 해결하기 COLLATE 이슈와 동일한 현상이었다.
(내부 docker postgre:17.4 와 AWS RDS PostgreSQL 17.2 모두) 기본값 en_US.UTF-8 이 적용되어 있었고, 한글 정렬순서가 올바르게 나오지 않았다.
SELECT datname, datcollate, datctype
FROM pg_database
WHERE datname = current_database();
|datname |datcollate |datctype |
|--------|-----------|-----------|
|postgres|en_US.UTF-8|en_US.UTF-8|
ko_KR.UTF-8 로 새 로케일 지정해서 데이터베이스 새로 만들고, 덤프 백업 & 복원처리를 진행해서 해결은 완료했는데,
간단하게 COLLATE "C" 로도 한글정렬문제를 해결 할 수 있겠다 싶었는데, ChatGPT와 이것저것 논의해본 결과(?) 문자코드순 정렬이라서 사전식 정렬과는 다소 차이가 있어서 완전한 해결책은 아닌 듯 싶다.
(비슷하게나마 해결은 되지만)
데이터베이스를 새롭게 만드는 게 어려우면, 특정 컬럼에만 COLLATE 를 지정해서 변경할 수 있다.
ALTER TABLE 테이블명
ALTER COLUMN 컬럼명 TYPE 데이터타입 COLLATE "C";
서비스가 아직 한국어와 영어만 지원해서, 별다른 고민없이 ko_KR.UTF-8로 처리하기는 했는데, 일본어나 중국어까지 지원하면 결국 Collation을 C 로 해야하는 것은 아닌가 싶은 생각도 들고,
ko_KR.UTF-8에서 일본어,중국어도 다 잘 정렬되지 않을까 싶은 생각도 들고, 혹은 정렬이 중요한 포인트라면 언어별로 컬럼을 파야할 것인가 하는 고민은 있는데, 일단은(?) 나중에 다시 고민하기로 했다.
AWS 주간 소식 모음: Amazon Bedrock, AWS Outposts, ECS Managed Instances, Builder ID 업데이트 등 https://aws.amazon.com/ko/blogs/korea/aws-weekly-roundup-amazon-bedrock-aws-outposts-amazon-ecs-managed-instances-aws-builder-id-and-more-october-6-2025/ #AWS #AWSKorea
#cosmoslide 작업일지 251012
이번에는 Announce 액티비티 지원하는 작업을 진행 중인데, 해커스펍이 어떻게 구현되어 있는지 하나하나 뜯어보면서 작업 중이다. 고려해야 할 사항이 몇 가지 있는데... 당장은 쉬운 것 순서대로 작업할 것들을 정리하고 있다.
- Phase 1 : 내가 팔로하고 있는 원격 계정에서 전달되는
Announce액티비티를 인박스에서 수신하는 과정을 핸들링한다. (원격에서는 followers에 cc 걸어서Announce액티비티를 전송하기 때문) - Phase 2 : 나를 팔로하고 있는 로컬 인스턴스 계정의 글을 재공유하는 매커니즘을 구현한다.
- Phase 3 : 나를 팔로하고 있는 원격 계정의 inbox에
Announce액티비티를 전달하는 매커니즘을 구현한다.
지금은 Phase 1에 신경쓰고 있는 상황. 허나, Phase 1을 작업하고 있는 과정에서 병목이 생겼다. 다행히 해결했다만.
Follow 액티비티가 언제부턴가 전송이 안되고 있어서 왜 그런가 했는데, 프로덕션 배포하는 과정에서 federation 옵션을 바꾼게 화근이 되었음. 백엔드와 프론트엔드가 하나로 합쳐져있을때는 origin 옵션에 URL 하나만 걸어두면 그만인데, 백엔드/프론트엔드 나눠놓은 상황에서는 프론트전용 URL(webOrigin)/백엔드전용 도메인(handleHost) 각각 분리를 해야했음. 그와 관련된 패치를 어제 했었던 것으로 기억한다.
변경사항이 있었다는걸 까먹은 상태에서, 로컬환경에서 원격 인스턴스에 Follow 액티비티가 왜 Unauthorized 에러가 뜨면서 전송이 되지 않았나했는데... 역시 이런 맥락이 있었던 것. 즉, handleHost(백엔드쪽 도메인)은 Tailscale에서 생성한 URL로 들어가는 반면, webOrigin은 localhost로 설정이 되어 있었기 때문에 서명하는 과정에서 오류가 발생한 것임. NODE_ENV 환경변수가 development 인 경우에만 webOrigin/handleHost를 같은값을 쓰는 걸로 임시방편으로 처리함. 관련 코드
해커스펍을 쓰고 있으면서도 정작 연합우주랑 액티비티펍 프로토콜에 대해선 큰 그림조차 사실 감이 잘 안 왔는데(...) 워드프레스에서 작년에 연합우주랑 액티비티펍 관련해서 영상들을 몇 개 올려서 보고 있는데 한방에 팍 이해가 되어서 재밌게 보고 있다. 액티비티펍 공동창시자인 Evan Prodromou랑 찍은 것도 있는데 왜 액티비티펍을 만들었는지에 대한 동기도 설명해줘서 좋았음..
11월 중순~11월 말 사이에 해커스펍 오프라인 밋업 Hackers' Public 두번째 모임을 진행하려고 하는데 "눈물없이 듣기 어려운 프론트엔드의 심연" 특집입니다...... 11월 1일~11월 8일 사이에 모집 공고 올릴듯????? 아직은 오피셜한 공지는 아니지만 정보만 슬쩍 흘려봅니다,,,
옆집 (ActivityPub 페디버스) 에서도 하던 얘기긴 하지만, 웹의 퍼블릭으로 올린 데이터는 그냥 어디서든 인덱싱되고, 저장될 것이라고 상정하고 행동하십시오...
오는 11月 8日 光云大學校에서 開催되는 FOSS for All 컨퍼런스 2025에서 제가 〈야크 셰이빙: 새로운 오픈 소스의 原動力〉이라는 主題로 基調演說을 하게 되었습니다!
올해 처음 열리는 FOSS for All 컨퍼런스는 “Free and Open Source Software for All”이라는 슬로건 아래, 모두를 爲한 오픈 소스 컨퍼런스를 目標로 하는 非營利 오픈 소스 커뮤니티 컨퍼런스입니다.
테슬라 팬보이들이 좀 밉상이긴 하지만, 그래도 기술에 대한 이해도가 높은 편일거라 생각했는데. 얼마전에 어디 게시글에서 FSD에 카메라 외에 라이다 등의 추가 센서를 쓰면, 여러 센서 입력 중에 뭘 신뢰해야하는지 결정해야하는 문제가 추가로 생겨서 안좋다... 라는 얘기를 보았다(그리고 다른 테슬라 팬보이들이 동조함).
어떻게 날아???
거의 10년 전부터 "2025년까지 살아야 하는 이유" 같은 제목으로 곳곳에서 이번 연휴를 예고해왔는데 나는 아무것도 준비하지 않았다. 그렇게 맥없이 연휴가 끝나간다...
새 블로그를 소개합니다: Gatsby에서 Astro로의 전환과 Contentful CMS 제거
blog.te6.in/post/blog-v2
새 블로그를 소개합니다
근데 왼쪽 같은 생각 들 때는 걍 무지성 딸깍이 누르는 것도 의외로 도움이 되긴 하는 듯...
당장 결과물 안 나와서 우울감에 빠져있을 때는 AI든 뭐든 써서 뭐라도 만들어내서 자기효능감 떡락 악순환에서 탈출하는 게 큰 도움이 됨
서버 이름들을 쭉 써 보다가
한국에 연합우주 서버가 참 많구나…했습니다
@biuwhdle.bsky.social 님의 #미니게임잼파티 에 참여해서 카드게임을 만들었습니다. 유니티는 이번이 처음이었는데 다행히 72시간에서 120시간으로 연장돼서 그럭저럭 적응할 수 있었어요 다행입니다.....🥹 시간이 없어서 구현하지 못한 부분이 많습니다. 직접 해보고 싶으시다면 → eatch.dev/archive/Cons... (규칙이 복잡합니다. 타래를 꼭 읽어주세요.) #미니게임잼파티_후기 🧵
#cosmoslide 개발일지 251008
k8s로 배포할까 했는데, 다들 뜯어말리기도 했고 claude code로 바이브코딩한거 부채청산할 자신도 없어서 그냥 docker compose에다가 리버스프록시는 caddy로 물려서 올리는 중...... 근데, 라우터 설정하는 부분이 병목인데(집에서 세팅해야함) 당장은 못하는 관계로 다른 기능을 붙이는데 집중하고자 한다.
어드민 페이지랑 메일링 서비스 연동 게섯거라...





















