인공지능의 급속한 발전이 한창인 지금, 그 한계가 어디까지인지 감도 잡히지 않습니다. 다양한 분야에서 빛을 보고 있는 인공지능이지만, 물리적인 한계로 인해 적용되지 못하는 분야도 있습니다. 이번 포스팅에서는 전력 공급이 제한적인 상황에서도 적용할 수 있는 초저전력 인공지능을 개발하는 스타트업 BrainChip에 대한 내용을 IEEE Spectrum에 개제된 포스팅을 통해 소개드립니다.
개요
뉴로모픽 컴퓨팅은 뇌에서 영감을 받았으며, 시드니에 기반을 둔 스타트업 BrainChip의 마케팅 책임자인 스티븐 브라이트필드는 이러한 점이 배터리로 구동되는 AI 처리 장치에 적합하다고 설명했습니다.
브라이트필드는 “그 이유는 진화에 있다”며, “우리 뇌는 전력 예산을 가지고 있었다”라고 말했습니다. 마찬가지로, BrainChip이 겨냥하는 시장 역시 전력에 제약이 있는 시장입니다. “배터리가 있고, 그 배터리에서 나오는 에너지로 AI를 구동해야 하는 상황에서 사용할 수 있는 전력은 한정적입니다”라고 설명했습니다.
오늘 BrainChip은 새로운 칩 설계인 Akida Pico가 이제 사용 가능하다고 발표했습니다. Akida Pico는 전력 제약이 있는 장치에서 사용하기 위해 개발된 제품으로, 작년에 발표된 BrainChip의 Akida 설계에서 간소화된 소형 버전입니다. Akida Pico는 1밀리와트 이하의 전력을 소모하며, 이는 응용 프로그램에 따라 더 적은 전력을 사용할 수도 있습니다. 이 칩 설계는 전력 및 무선 통신 용량이 제한된 모바일 폰, 웨어러블 기기, 스마트 가전제품과 같은 소형 사용자 장치를 대상으로 한 극한 엣지를 겨냥하고 있습니다. Akida Pico는 올해 초 발표된 Innatera의 T1 칩과 2023년 7월에 발표된 SynSense의 Xylo와 같은 엣지용 뉴로모픽 장치들과 경쟁하게 됩니다.
뉴런 스파이크로 에너지 절약
뉴로모픽 컴퓨팅 장치는 뇌의 스파이크 특성을 모방합니다. 기존의 논리 게이트 대신, ‘뉴런’으로 불리는 계산 단위들이 서로 소통하기 위해 스파이크라 불리는 전기적 신호를 보냅니다. 이 스파이크가 다른 뉴런에 도달해 특정 임계값을 넘으면, 해당 뉴런이 활성화됩니다. 각 뉴런은 글로벌 시계와 독립적으로 스파이크를 생성할 수 있어 매우 병렬적인 처리가 가능합니다.
이 방식의 장점 중 하나는 스파이크가 발생할 때만 전력이 소모된다는 점입니다. 일반적인 딥러닝 모델에서는 인공 뉴런이 단순히 입력에 대한 연산을 수행하지만, 뉴로모픽 뉴런 네트워크에서는 뉴런이 입력 처리 외에도 내부 상태를 가지게 됩니다. 이는 현재 입력뿐만 아니라 과거 입력의 히스토리에도 출력이 의존할 수 있다는 것을 의미합니다. Intel의 뉴로모픽 컴퓨팅 연구소장인 마이크 데이비스는 “입력이 이전 입력과 크게 다르지 않으면 뉴런은 아무런 출력을 내지 않을 수 있어 에너지를 절약할 수 있다”고 설명했습니다.
데이비스는 또한, 뉴로모픽 컴퓨팅이 신호 스트림을 실시간으로 처리하는 데 특히 강점을 보인다고 말했습니다. “데이터 스트림 전체를 수집한 후 일괄 처리하는 방식으로는 감당할 수 없는 상황에서, 스트리밍 모드로 실시간 처리를 해야 할 때 뉴로모픽 컴퓨팅이 뛰어납니다”라고 덧붙였습니다. 그의 팀은 최근 자사의 Loihi 칩이 스트리밍 사용 사례에서 GPU의 에너지 사용량의 천분의 일에 해당하는 에너지를 소비했다는 연구 결과를 발표했습니다.
Akida Pico는 뉴럴 처리 엔진과 이벤트 처리 및 모델 가중치 저장용 SRAM 장치, 스파이크 변환 및 구성용 메모리 장치, 그리고 선택적 주변 장치를 포함하고 있습니다. 브라이트필드는 일부 간단한 감지기와 같은 장치에서는 마이크로컨트롤러나 외부 처리 없이 독립적으로 칩을 사용할 수 있다고 설명했습니다. 추가적인 온디바이스 처리가 필요한 경우에는 마이크로컨트롤러, CPU, 또는 기타 처리 장치와 결합해 사용할 수 있습니다.
BrainChip은 자사 장치에서 최소 전력 사용을 최적화한 AI 모델 아키텍처 개발에도 힘써왔습니다. 이들은 음성에서 키워드를 감지하는 응용 프로그램을 통해 그 기술을 선보였으며, 이는 ‘Hello, Alexa’와 같은 키워드로 활성화되는 Amazon의 Alexa와 같은 음성 비서에 유용합니다.
BrainChip 팀은 최근 개발한 모델 아키텍처를 사용하여 기존 마이크로프로세서에서 실행되는 전통적인 모델 대비 전력 사용을 5분의 1로 줄였습니다. 이는 자사 시뮬레이터에서 입증되었습니다. 브라이트필드는 “아마존은 Alexa를 깨우기 위해 클라우드 컴퓨팅 서비스에 연간 2억 달러를 지출하는 것으로 알고 있습니다”라며, “그들은 이를 마이크로컨트롤러와 뉴럴 프로세싱 유닛(NPU)을 사용해 처리하고 있지만 여전히 수백 밀리와트의 전력을 소비합니다”라고 설명했습니다. 만약 BrainChip의 솔루션이 각 장치에서 주장한 대로 전력 절감을 제공한다면, 그 영향은 상당할 것이라고 덧붙였습니다.
두 번째 시연에서는 유사한 머신러닝 모델을 사용하여 청력 보조 장치나 소음 제거 헤드폰에 사용할 수 있는 오디오 소음 제거를 시연했습니다.
현재까지 뉴로모픽 컴퓨터는 상업적으로 광범위하게 사용되지 않았으며, 이러한 소형 엣지 장치들이 성공할지는 두고 봐야 합니다. 이는 저전력 AI 응용 프로그램의 제한된 성능 때문이기도 합니다. Intel의 데이비스는 “아주 작은 신경망 수준에서는 문제에 기적적인 해결책을 제공할 수 있는 마법이 제한적일 수밖에 없습니다”라고 말했습니다.
그러나 BrainChip의 브라이트필드는 이러한 응용 분야에 대한 가능성을 긍정적으로 보고 있습니다. 그는 “음성 깨우기가 될 수도 있고, 이어버드, AR 안경, 청력 보조 장치에서의 소음 감소가 될 수도 있습니다. 우리가 목표로 하는 모든 사례들입니다. 또한, 우리가 아직 알지 못하는 누군가가 발명할 새로운 사용 사례도 있을 것이라고 생각합니다”라고 설명했습니다.
마무리
이번 포스팅에서는 BrainChip의 뉴로모픽 컴퓨팅 기술과 그 적용 가능성에 대해 살펴보았습니다. 뉴로모픽 칩이 전력 소모를 크게 줄이며, 음성 인식, 소음 제거와 같은 다양한 실시간 처리 응용 분야에서 혁신을 이끌어낼 수 있음을 확인했습니다. 비록 현재 상업적 활용은 제한적일 수 있지만, 미래에는 더 많은 창의적인 사용 사례가 등장할 가능성이 큽니다. AI 기술이 발전함에 따라, BrainChip과 같은 선도적인 기업들이 저전력, 고효율 솔루션을 제공함으로써 새로운 시대를 열어갈 것입니다.