hackers.pub 이라면 계실 것 같아서... 혹시 이 문제를 해결할 만한 천재데이터엔지니어 분이 계시다면 고견을 여쭙고 싶습니다... 블스 한국어 클러스터에 지금 러브휴먼들이 너무 많아서 일반 사용자들이 고생하고 있습니다 그나마 다행인 건 블스에는 사용자 리스트라는 기능이 있어서 저런 러브휴먼 계정들을 넣은 리스트를 블락 리스트로 공유하는데 아무래도 양이 양인지라... 프로그램을 짜서 긁어넣고 있어요 문제는 저런 중간자(?) 계정들이 자꾸 빨려 들어가곤 합니다 그렇다고 제가 직접 일일히 확인하기엔 제 시간과 정신력에도 한계가 있으니... 데이터를 기반으로 걸러내야하는데 어떤 알고리즘? 이 러브휴먼과 그냥 휴먼을 걸러내기 가장 좋을까요? 단순 키워드 정도만 던져주셔도 감사하겠습니다!

0

If you have a fediverse account, you can reply to this note from your own instance. Search https://hackers.pub/ap/notes/0197d965-58bf-7658-978c-9f7600e68633 on your instance and reply to it.

@bin_bash_shell이수호 시각화툴을 써보긴 했는데 잘 모르겠습니다... 일단 팔로 데이터와 유저 프로필 정보 데이터가 DB에 저장되어 있고 파이썬으로는 코파일럿 도움을 받아 조금 돌려보긴 했는데 제가 아는 게 너무 기초적인 수준이라 어디서부터 공부해야할 지 알려주시면 감사하겠습니다!

0