Проект Debian ввёл в строй поисковую систему по коду доступных в дистрибутиве пакетов

Разработчики проекта Debian представили новый сервис Debian Code Search (codesearch.debian.net), в рамках которого создана поисковая система по исходному коду доступных в дистрибутиве приложений и библиотек. В поисковой системе проиндексировано около 18 тысяч пакетов, в сумме содержащих более 140 Гб кода открытых проектов. В индекс включены только пакеты из репозитория «main», репозитории «non-free» и «contrib» не участвуют в индексации. При выполнении поисковых запросов поддерживается использование регулярных выражений, допустима фильтрация по типам файлов (например, filetype:perl) и пакетам (например, package:linux).

Поисковый движок Debian развивается как открытый проект, но код будет публично опубликован только в январе 2013 года, одновременно с научной работой создателя проекта (раньше опубликовать код не получится, так как возникнут проблемы с доказательством оригинальности разработки). Работа сервиса организована с использованием наработок, применённых в написанной на языке Go утилите CodeSearch, специально оптимизированной для поиска по большому объему кода с использованием регулярных выражений RE2 и использующей индексы Trigram, разработанные компанией Google для сервиса Google Code Search.

Из других систем поиска по исходным текстам можно отметить opensearch.krugle.org, koders.com и codase.com.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.