전체 글315 [LLM] 안드레이 카파시 : ChatGPT와 같은 LLM 기술의 심층 분석(훈련 과정) 컨택한 랩실 교수님께 LLM에 대해서 기초적인 지식을 쌓고 싶다고 말씀드렸더니 석사분들을 통해서 강의를 추천해주셨다! Pretraining(사전 훈련 단계)download, preprocesspretraining의 첫번째 단계는 인터넷에서 정보를 다운받는 것이다.(데이터 수집)우리는 고품질, 아주 많은 데이터를 얻고자 노력한다. 이것을 달성하기 위해서는 위와 같은 단계를 거친다.url filtering은 데이터를 수집하고싶지 않은 사이트(광고, 유해사이트 등등)을 필터링하고, text extraction에서는 html 코드에서 필요한 정보 텍스트만 얻는 등의 과정을 거친다.또한 language filtering은 데이터셋에 언어를 어떤 비율로 포함시킬 것인지를 정할 수 있다. 만약 영어 비율을 높인다면 .. 2025. 9. 24. 잔디는 개발잔디 폭파 안녕하세요제목 그대로 그렇게 됐습니다근데 이전에 쓴 글은 아까우니까 남겨두려구요(그럼 폭파가 아닌가..?) 1년전까지만 해도 저는 평생 개발을 해야지 라는 생각으로 공부를 해왔는데요개발을 막상 일로 해보니 생각보다 적성에 맞지 않는다는 생각이 들었고, 현실적으로 봤을 때 AI가 많이 발전하고 있는 상황에서 살아남을 수 있는 실력일까?를 생각했을 때 아니라는 생각이 들었습니다. 동시에 컴퓨터구조와 운영체제를 다시 공부해보니 흥미가 생겨 깊게 공부해보고 싶다는 생각이 들었고, 이제까지 쌓아온 역량을 어떻게 활용할 수 있을지 + 어떤 분야가 전망이 좋을지를 모두 고려해본 결과 AI 클라우드 플랫폼 연구원이 되고 싶다는 결론이 났습니다. 그래서 관련 분야로 취준을 했고, 감사하게도 합격하게 되었습니다! 바로 기.. 2025. 9. 21. 정보처리기사 필기 벼락치기 합격 후기 안녕하세요오늘은 정보처리기사 필기 벼락치기 후기를 써볼게요공부기간은 3일 정도였습니다 하하 공부저는 전공자긴 한데요 좀 지식이 잘 휘발되는 편이라 그냥 컴퓨터에 대한 지식이 많았다기보다는 감이 좀 있었다? 정도의 상태로 시작했습니다. 처음에는 개념을 보려고 했는데 한 장 보고 너무 지루해서 덮었어요대신 기출을 풀기로 했답니다. 저는 이 시나공 문제집을 풀었어요처음에는 유튭에서 사람들이 하는 것처럼 한문제 읽고, 답 확인하고 개념 확인하고 이런 식으로 진행했는데 너무 지루했어요그래서 나중에는 진짜 시험처럼 한 과목 풀고 채점하고, 답 확인하는 방식으로 공부했어요이렇게 하니까 더 집중해서 풀 수 있었고, 나중에 더 기억에 잘 남더라구요 저는 한 5회정도 풀었어요 그러고 cbt 방식도 체험해보고싶어서 http.. 2025. 9. 17. 벼락치기로 오픽 IH 받은 후기 안녕하세요! 오늘은 오픽 후기를 써보려고 합니다놀랍게도 5일 공부하고 IH를 받았습니다 공학 관련 직군(특히 컴퓨터 쪽) 으로 취업할 예정이라 원래 어학성적에 전혀 관심 없었는데 자꾸 면접볼 때 제 낮은 어학성적이 언급되지 뭐에요?정말 영어 성적 필요 없다는 말은 다 거짓말인거 같아요제 주변 분도 아주 큰 빅테크 기업 취업하셨는데 영어 성적에 대해서 물어보셨대요이대로 가다간 영어성적 때문에 발목잡힐 것 같아서 도전을 했습니다 기존 영어 수준음.. 일단 토익 점수가 있었는데요 매우 낮았습니다그리고 교양으로 들었던 대학영어 점수가 제 성적표에 크나큰 오점일 정도로 저는 어려운 어휘가 포함된 문장을 읽고 이해하고, 문제를 푸는 것에 매우 약해요 사실 영어로 말하는 것도 못했는데 학교에서 글로벌인재트랙으로 2달.. 2025. 8. 31. 정보과학회 kcc 2025(한국 컴퓨터 종합 학술대회) 후기 요즘 블로그를 많이 못썼다..회사일이라 함부로 글 못씀 + 이것저것 취업준비를 하다보니 이전보다 쓸 것이 많이 줄었다ㅜ모든게 끝나면 썰들을 많이 들고 오겠다! 오늘은 비록 갔다온지는 꽤 됐지만..정보과학회 kcc에서 논문 발표한 후기를 작성해보려고 한다. 위치위치는 제주 국제컨벤션 센터였다.학교에서 비행기값이랑 숙소값, 식비는 모두 지원해주셨다(감사합니다) 포스터우리는 박사님께서 보내주신 기본 양식을 바탕으로 논문에 대한 포스터를 만들었다.논문 포스터에는 정말 기본적인 내용만 핵심적으로 담았다.주로 그래프 등의 시각자료를 크게 넣어서 한눈에 이해하기 쉽도록 하였다. 가면 포스터를 붙이는 판(?)이 있다. 이 때 자신의 포스터 발표 장소 번호를 잘 찾아서 준비한 포스터를 붙이면 된다.우리는 테이프를 준비.. 2025. 8. 25. 백준 [자바 java] 1522 : 문자열 교환 https://www.acmicpc.net/problem/1522 이 문제는 최소한의 횟수로 노드를 교환하여 같은 문자열끼리 나열되도록 하는 문제이다 처음엔 bfs로 풀어야하나(그놈의 bfs...)했는데 아무리 생각해도 너무 오래걸린다고 생각했다.알고보니까 슬라이딩윈도우라는 알고리즘으로 풀어야한다고 한다.슬라이딩 윈도우는 네트워크 할 때 봤다!탐색해야하는 배열의 범위가 주어진다면 처음부터 끝까지 한칸씩 이동하면서 가능한 배열의 가짓수를 모두 탐색하는 것이다. 여기서는 모든 a가 일렬로 나열되어야하므로, a의 갯수만큼 탐색을 해주었다. aabbbaba 이런 배열이 있으면 여기서는 a가 4개이다.(aabb)baba 이 경우는, b가 윈도우 내 2개이므로, 2번 교환을 해야한다.a(abbb)aba 이 경우는 .. 2025. 6. 29. 이전 1 2 3 4 5 6 ··· 53 다음