검색 엔진

덤프버전 : r20240101


1. 개요
2. 목표
3. 기능
4. 목록
4.1. 한국 서비스 중
4.2. 해외 서비스 중
4.3. 서비스 종료


1. 개요[편집]


search engine. 월드 와이드 웹 상에 존재하는 정보웹 사이트검색하기 위한 프로그램이다. 웹의 정보를 긁어오는 소프트웨어는 크롤러라고 부르고, 그 행위는 크롤링이라고 부른다. 참고로 일반 검색 엔진에 안 잡히는 웹을 딥 웹이라 한다.

검색 엔진은 프로그램을 가리키는 것이고 그 프로그램으로 검색 서비스를 제공하는 곳은 '검색 사이트'지만, 사실상 검색 엔진이라는 용어로 두 의미를 혼용하고 있다. 또한, 사실상 포털 사이트와 동의어로 쓰이기도 한다. 이는 대부분의 포털 사이트가 검색 서비스를 제공하고 있기 때문이다.

2010년대 들어선 모바일의 강세와 유튜브의 강세로 검색 엔진의 입지가 좁아지는 중이다. 현대 들어서 제대로 된 검색은 구글을 통해 시행할 뿐 대부분의 정보는 검색이 아닌 유튜브나 SNS로 얻는게 대세가 되었기 때문. 네이버는 검색엔진의 힘이 2000년대 비해 보잘것 없다는 얘기를 듣지만 쇼핑[1], 메신저, 웹툰 등을 강화해 좋은 평가를 받고 있는 반면 검색 엔진에 역량을 집중한 바이두는 쇼핑의 알리바바, SNS와 메신저의 텐센트에 비교해 모바일 환경에 전혀 강점이 없다는 평가를 듣고 있다.

그러다 2022년 11월 말 출시된 ChatGPT의 등장으로 대형 언어 모델 기반의 대화형 인공지능 서비스가 주목을 받자 인공지능과 검색엔진을 결합한 AI 검색엔진이 새로운 비즈니스 모델로 떠오르며 또다른 변화를 예고하고 있다. 자세한 내용은 인공지능 검색 엔진 문서 참고.


2. 목표[편집]


  • 검색의 품질, 효과성: 사용자가 원하는 정보에 부합하는 정보를 모으는 능력이다.

  • 검색의 속도, 효율: 이름 그대로 검색 속도이다.


3. 기능[편집]


  • 색인 과정: 빠른 검색을 위해 색인(Index)이라 하는 키워드를 만들고 정리한다.
    • 텍스트 획득
      • 크롤링
      • 피드 (Feed): 문서를 실시간으로 나열하는 기능.
      • 인코딩
    • 텍스트 변환: 텍스트를 색인어로 변환한다.
      • 파서
      • 불용어 제거
      • 스테밍
      • 링크 추출 및 분석
      • 정보 추출
      • 분류
    • 색인 생성 / 검색 등록: 빠른 검색을 위해 데이터베이스를 만든다.
      • 통계
      • 가중치 부여
      • 인버전
      • 색인 분산

  • 질의 과정
    • 사용자 경험 및 사용자 인터페이스
      • 질의 입력
      • 질의 변환
      • 결과 출력
    • 순위부여: 사용자에 맞게 검색의 우선순위를 만든다.
    • 평가: 품질과 속도를 평가.
      • 로깅
      • 순위부여 분석
      • 성능분석


4. 목록[편집]


다른 업체(들)로부터 검색결과를 사온 후 편집하여 보여주는 사이트는 검색 결과를 사오는 회사의 이름을 같이 기재하여 목록에 포함시킨다.

검색 말고도 뉴스, 게임 등 다른 서비스를 제공하는 종합 포털 사이트의 경우 독자적인 자체 검색엔진을 보유한 경력이 있는 경우에만 이 목록에 추가한다. 단, 타 사이트에서 검색결과를 제공받으면 ▩표를 한다.

4.1. 한국 서비스 중[편집]


  • 구글: 한국 포함 전세계에서 가장 많이 사용되는 검색 엔진.
  • 네이버 : 한국 2위 검색 엔진
  • Bing: Microsoft Edge의 기본 검색 엔진이기도 하다. 선호되지는 않으나 최근 빙 gpt로 주목을 받고 있다.
  • zum: 영문 검색, 이미지 검색 등 일부 검색은 구글 맞춤 검색을 사용하고 있다.#1#2
  • 네이트▩: 다음으로부터 검색 결과를 제공받는다.[2]
  • 다음: 자체적 검색 외에도 Bing의 검색 결과도 보여준다.
  • 드림위즈
  • 나무위키: 자체적 검색 엔진이 있으며, 크롬과 웨일 브라우저에서 기본 엔진으로 설정이 가능하다.
  • 코리아닷컴

4.2. 해외 서비스 중[편집]


  • 구글 : 세계 1위 검색 엔진
  • AOL▩ : Bing에서 검색결과를 제공받는다.
  • Ask Jeeves▩ : 구글에서 검색결과를 제공받는다.
  • Brave Search▩ : 자체 검색결과를 제공하나, 결과가 존재하지 않을 때 Google Fallback 옵션을 이용하여 구글 검색결과를 받아볼 수 있다.
  • Boodigo
  • Bing
  • Disconnect▩ : 구글, Bing, 야후에서 검색결과를 제공받았지만 현재 구글은 차단된 상태. Tor 브라우저 기본 검색 엔진.
  • Dogpile▩ : 구글, 야후에서 검색결과를 제공받는다.
  • DuckDuckGo: 개인정보를 전혀 수집하지 않는 개인정보 중시 검색엔진. 개인정보 보호에 관심이 많아지는 추세에 전세계 점유율 2위를 찍었다가 다시 4~5위로 내려갔다.
  • Ecosia : 검색엔진을 이용한 만큼 나무를 심는 사회적 기업.
  • Gigablast
  • ixquick▩: 구글, 야후, Bing에서 검색결과를 제공받는다. 과거 Tor 브라우저 기본 검색 엔진. 현재 StartPage에 인수됨.
  • StartPage.com▩: 구글에서 검색결과를 제공받는다. DuckDuckGo와 같은 프라이버시 중시 검색 엔진.
  • Wolfram Alpha
  • 룩스마트: 2015년에는 검색광고 업체로 바뀌었다.
  • 라이코스▩: Bing으로부터 검색결과를 제공받는다.
  • 바이두
  • 얀덱스
  • 익사이트▩: Dogpile에서 검색결과를 제공받는다.
  • 야후!▩: Bing에서 검색결과를 제공받는다.
  • 야후! 재팬▩: 구글에서 검색결과를 제공받는다.
  • 핫봇▩: 라이코스에서 검색결과를 제공받는다.
  • 엘라스틱 서치: 오픈소스 검색엔진.
  • 웹크롤러: 현재까지 살아남은 검색 엔진 중 최장수 엔진.[3] 소형 검색 엔진으로서는 드물게 자체 엔진으로 서비스 중이지만,[4] 과거 많은 사람들이 찾던 대형 검색 엔진 시절이던 AOL 산하였을 때가 무색하게도 현재는 검색 결과의 퀄리티가 썩 좋지 않아 쓰는 사람이 거의 없기에 운영은 하지만 사실상 운영하는 기업의 실험장 역할이라고 봐야 한다.


4.3. 서비스 종료[편집]



  • 해외
    • Blekko
    • Cuil
    • Infoseek
    • Teoma
    • 와카노: 맨 처음에는 세계로 진출하는 한국 검색엔진이었지만 얼마 안 가 망하고 일본 지사만 남아 지금은 일본 검색 엔진이다. 검색하려 하면 서버랑 연결이 안 되는 건 넘어가기로 하자.
    • 잉크토미
    • 알타비스타
파일:크리에이티브 커먼즈 라이선스__CC.png 이 문서의 내용 중 전체 또는 일부는 2023-11-11 11:07:03에 나무위키 검색 엔진 문서에서 가져왔습니다.

[1] 네이버쇼핑은 네이버페이와 결합해 2020년 현재 한국 2위 인터넷쇼핑 업체로 자리잡았다.[2] 엠파스 인수 시까지만 해도 자체적인 검색 엔진을 보유했었다.[3] 단, 자체 홈페이지로 검색 엔진 서비스를 제공한 최초의 기업은 구글이다. 웹크롤러는 처음 시작할 때는 워싱턴 대학교 네트워크 홈페이지 상에서 기능했고, 이후 AOL에 인수된 후로는 AOL의 하위 페이지로 기능하다가, 2001년이 되어서야 자체 홈페이지로 서비스를 제공하였다.[4] 2001년부터 InfoSpace라는 회사가 운영 중인데, 같은 회사에서 운영하는 메타 검색 엔진 MetaCrawler의 경우에는 일찌감치 자체 엔진을 폐기하였고 현재는 Bing에서 검색 결과를 제공받는다.