소프트웨어에서 가장 창의적이고 영향력 있는 아이디어는 종종 오픈소스로 등장한다. 코드를 공유하면 전 세계 기여자 커뮤니티가 함께 협력해 프로젝트를 발전시킬 수 있다. AI도 예외는 아니다. AI는 막대한 연산 능력을 요구하지만 분산된 팀이 협력하면 목표를 달성할 수 있다. AI는 모든 노력을 합쳤을 때 더 큰 효과를 발휘하는 기술 분야다.
여기서 소개하는 프로젝트를 통해 AI의 혁신이 어떻게 지능적이고 자율적인 컴퓨터의 꿈을 어떻게 현실로 바꾸고 있는지 볼 수 있다. 다른 프로젝트의 시작점으로 삼거나, 영감을 얻어 무언가 대단한 것을 만들어내는 청사진으로 활용할 수도 있다.
때로는 페이지에 삽입하는 이미지를 더 보기 좋게 만들기 위해 디테일이 필요할 때가 있다. 업스케일(Upscayl)은 이미지 해상도를 높여 원하는 선명도와 디테일을 구현한다. 적절한 하드웨어만 있다면 디지털 아트웍이나 사진 품질을 개선하거나 디테일을 더하는 좋은 방법이다. 다만, 이런 디테일은 AI가 거의 완벽하게 구현한다는 점을 기억하라. 즉, 업스테일은 디지털 아티스트가 만든 가상의 이미지를 개선하는 데는 이상적이지만 범죄 현장의 증거처럼 절대적인 정확성이 요구되는 이미지에는 적합하지 않다.
개발자는 명령줄을 통해 컴퓨터의 OS와 상호 작용하는 데 상당한 시간을 소비한다. 간과하기 쉽지만, 그 모든 시간을 합치면 엄청난 시간이 된다. 니로(Nyro)는 스크린샷 캡처, 윈도우 크기 조정, 애플리케이션 간 데이터 동기화와 같은 일상적인 작업을 처리하는 일렉트론(Electron)을 기반으로 작성된 오픈소스 프로젝트다. 이와 같은 일상적인 작업을 자동화하면 많은 시간을 절약할 수 있어 궁극적으로 생산성 향상에 도움이 된다.
일부 개발팀은 대부분 작업을 슬랙 채널에서 수행한다. 협업 앱의 게시물은 1차 문서화의 훌륭한 초안이 된다. 게페토(Geppetto)는 채널을 오픈AI나 앤트로픽, 제미나이 등 여러 LLM과 연결해 사용자의 생각을 정리하고 향상시킬 수 있는 슬랙 봇이다. 문서에 생동감을 더하기 위해 아트 작업을 원하는 경우 게페토는 달리(Dall-E)에 요청을 보낼 수도 있다.
초기의 LLM은 질문에 답하고 학습 데이터 세트에 있는 모든 지식을 사용해 약간의 예술성을 생성하는 기능을 제공한다. 이런 LLM이 인터넷을 자유롭게 돌아다니며 인간이 사용하는 것과 동일한 도구를 모두 사용할 수 있다면 어떨까? E2B는 사람이 매일 사용하는 여러 도구와 LLM을 연결하는 에이전트 샌드박스다. 즉, 웹 브라우저, 깃허브 코드 리포지토리, 린터와 같은 명령줄 도구를 사용할 수 있다. LLM은 이런 도구의 기능을 사용해 클라우드 인프라 관리와 같은 유용한 작업을 수행할 수 있으므로 업무 부담을 덜어준다.
모든 사람이 훈련을 위해 모든 데이터를 멀리 떨어진 AI GPU에 업로드하고 싶어 하는 것은 아니다. 데이터라인(Dataline)은 LLM을 사용해 데이터베이스에서 데이터를 가져오는 SQL 명령을 생성한다. 그런 다음, 이 코드는 로컬 데이터에 대한 로컬 연결을 사용해 데이터 과학 보고서를 생성한다. 이는 분석을 위한 고전적인 데이터 과학 알고리즘과 이를 안내하는 LLM을 병합하는 하이브리드 접근 방식이다.
데이터 집합으로 작업을 시작하고 싶지만, 때로는 데이터 집합을 추출하고 다시 포맷하는 수고를 하고 싶지 않을 때가 있다. 특히 데이터 집합이 큰 경우 이런 프로세스는 많은 시간이 소요될 수 있다. 스월 커넥트(Swirl Connect)는 여러 표준 데이터베이스를 대부분의 표준 LLM 및 RAG 검색 인덱스와 연결한다. 필요한 모든 데이터가 한곳에 있으므로 트레이닝에만 집중할 수 있다.
LLM의 등장으로 ‘프롬프트 엔지니어링’이라는 완전히 새로운 직무가 탄생했다. 프롬프트 엔지니어는 개발자가 사용하는 알고리즘과 달리, 단어를 조정하고 긴 지침을 작성해 LLM이 올바른 결과를 생성하도록 유도한다. 재치 있는 입담과 언어 감각이 필요한 역할이다. DSPy는 LLM 교육에 보다 체계적인 접근 방식을 도입하고자 하는 도구다. 단어와 구문 대신 모듈과 최적화 도구를 연결해 LLM을 위한 파이프라인에 배치한다. DSPy를 사용하는 개발자는 언어적 뉘앙스에 대해 걱정하는 시간을 줄이고 코드 작업에 더 많은 시간을 할애할 수 있다.
생성형 AI의 주요 과제는 AI가 경로를 벗어나지 않도록 하는 것이다. 포트키 게이트웨이(Portkey Gateway)의 엔지니어들은 생성형 AI 파이프라인에 더 많은 제어 기능을 통합할 수 있는 방법을 찾아냈다. 가드레일(Guardrails)이라고 하는 비동기 함수는 AI가 생성한 답변의 발전을 추적하고 파이프라인의 다양한 단계에서 ‘투표’를 진행한다. 투표를 할 때마다 답변이 개선되며, 그 결과 환각을 줄이고 더 정확한 답변을 제공할 수 있다.
새로운 데이터 세트로 파운데이션 LLM을 학습시키는 데는 많은 비용이 든다. 언슬로스(Unsloth)는 가장 일반적인 오픈소스 모델에 대해 이런 훈련을 최적화하도록 설계된 도구다. 일부 설명에 따르면, 이 도구의 오픈소스 버전을 사용해 모델 학습 속도를 2~5배 높일 수 있다. 전문가용 버전은 최대 30배까지 빠르게 만들 수 있다. 신중하게 수기로 작성된 커널 코드는 메모리 사용량을 줄이면서 정확도를 유지하거나 심지어 높이는 방식으로 적용된다.
전 세계 대부분 데이터는 방대한 테이블에 저장돼 있으며, 종종 SQL로 액세스할 수 있다. 하지만 안타깝게도 훌륭한 SQL 쿼리를 작성하는 방법을 아는 사람은 거의 없다. 유능한 프로그래머조차도 빠르고 효율적인 SQL 쿼리를 작성하는 데 어려움을 겪는다. 렌(Wren AI)는 자연어를 SQL로 변환하는 도구다. 사용자가 일반적인 영어 표현으로 질문하면 AI가 이를 SQL로 번역해 모든 사람의 시간과 수고를 덜어준다.
오늘날 대부분 사람은 나중에 참조하기 위해 어딘가에 방대한 양의 디지털 문서를 보관하고 있다. 문제는 필요할 때 적절한 인용문과 데이터 포인트를 찾는 것이다. 애니씽LLM(AnythingLLM)은 문서 더미를 유용한 정보로 정리해 준다. 문서를 LLM 또는 RAG 시스템에 입력한 다음, 필요한 답변을 쿼리하면 된다. 이 도구는 리눅스, 맥OS 또는 윈도우 시스템에서 실행되며, 응답은 음성-텍스트 변환 등 다양한 형식으로 제공된다.
editor@itworld.co.kr
원문보기:
https://www.itworld.co.kr/news/352615#csidx027f7dc9b22fa2eb13a753ff8b31d0d