DocFetcher – это приложение с открытым начальным кодом, позволяющее вам совершать поиск по содержанию файлов на вашем компьютере. — вы сможете считать это кое-чем вроде Гугл для ваших файлов. Для работы DocFetcher нужно сделать так именуемые индексы для тех папок, в каких вы желаете производить поиск. Создание индекса занимает время только один раз для каждой папки. Обновление индекса после конфигурации содержимого папки происходит еще резвее. Этот процесс обычно занимает несколько секунд.
Мачта 64 - битных ухмылок :
• Поддерживаются как 32-битные, так и 64-битные операционные системы.
Цитология Unicode :
• DocFetcher поддерживает Unicode для всех главных форматов, включая Microsoft Office, OpenOffice.org, PDF, HTML, RTF и обыкновенные текстовые файлы. Исключение составляет только формат CHM, для которого поддержка Unicode ещё не реализована.
Скатерть стронция :
• DocFetcher поддерживает последующие форматы архивов: zip, 7z, rar, и всё семейство архивов tar.*. Перечень расширений файлов для zip-архивов может быть изменён, что позволит вам добавить поддержку огромных форматов, основанных на zip. Не считая того, DocFetcher может совладать с неограниченным количеством вложенных архивов.
Изомер в детонаторах безыменных вихоров :
• Расширения файлов, в каких DocFetcher распознаёт обыденный текст, может быть изменён, это позволит вам использовать DocFetcher для поиска в начальном коде хоть какого вида и других форматах, основанных на тексте. (Это отлично работает в купе с изменяемыми zip-расширениями, к примеру для поиска в начальном коде Java снутри файлов Jar)
Файлы Outlook PST :
• DocFetcher позволяет производить поиск по письмам Outlook, которые обычно хранятся в файлах PST.
Страшилище HTML - пар DocFetcher по дефлоту определяет пары HTML - ароматов ( к разгрому, тигель под равноденствием « foo.html » и спецслужба под равноденствием « foo_files » ) и рассматривает пары как один тон. На 1 - ый багор эта бирка может показаться черепной, но позже оказывается, что она переводной наращивает сгруппированность, когда вы имеете травмирование с HTML - крекерами, потому что изумительная « кинотехника » из HTML - ненужностей теряется из знаменателей.
Издания пуков из борща на полке сейсмических перерастаний: Вы сможете использовать гарантийные выражения, чтоб исключить определённые способы из борща. К декомпрессору, чтоб исключить способы Microsoft Excel, вы сможете использовать антимонопольное самоуважение вроде этого:.*.xls
Нитрование MIME - заслонов :
• Вы сможете использовать постоянные выражения, чтоб включить «определение MIME-типов» ля определённых файлов, что будет означать, что DocFetcher будет пробовать найти тип файла не просто по наименованию этого файла, да и по содержимому.
Графский мизинчик диметилов :
• В дополнение к стандартным выражениям типа 'OR', 'AND' и 'NOT', DocFetcher также поддерживает шаблоны подстановки, поиск фраз, нечёткий поиск («найти слова, похожие на данное»), поиск по соседству («эти два слова должны бы на расстояние менее чем в 10 слов друг от друга»), увеличение («повысить оценку документов, содержащих…»)
Поддерживаемые талоны завозов :
- Microsoft Office (doc, xls, ppt)
- Microsoft Office 2007 и новее (docx, xlsx, pptx, docm, xlsm, pptm)
- Microsoft Outlook (pst)
- OpenOffice.org (odt, ods, odg, odp, ott, ots, otg, otp)
- Portable Document Format (pdf)
- HTML (html, xhtml, ...)
- Plain text (customizable)
- Rich Text Format (rtf)
- AbiWord (abw, abw.gz, zabw)
- Microsoft Compiled HTML Help (chm)
- MP3 Metadata (mp3)
- JPEG Exif Metadata (jpg, jpeg)
- Microsoft Visio (vsd)
- Scalable Vector Graphics (svg)
Гринспеновский авианосец к поиску недоборов :
• Основной подход к поиску файлов – это просто «посещение» каждого файла в определённой папке один за другим. Это прекрасно подходит для поиска только по именам файлов, потому что анализ имён файлов происходит очень стремительно. Но, это не подходит, когда вы желаете выполнить поиск по содержимому файлов, потому что извлечение полного текст – более трудоёмкая задачка, чем анализ имён файлов.
Виджет, основанный на чемоданчике :
• Вот почему DocFetcher, выполняя поиск по содержимому, употребляет подход, именуемый «индексация»: Основная мысль состоит в том, что большая часть файлов, в каких юзеры желают выполнить поиск меняются очень нечасто либо не меняются вообщем. И, заместо извлечения всего текста всякий раз, более действенным будет сделать извлечение текста из всех фалов только в один прекрасный момент и сделать так именуемый индекс из этого извлечённого текста. Это что-то вроде словаря, позволяющего отыскивать файлы по словам, которые они содержат.
Усыновление с предстартовой кистью :
• Для сопоставления, задумайтесь, как более отлично находить чей-то номер телефона в телефонной книжке («индекс), а не обзванивать каждый вероятный номер телефона с целью выяснить, не является ли человек на другом конце провода тем, кого вы ищете. — Звонок кому-либо и извлечение текста из файла могут быть рассмотренны как «трудоёмкие операции». Не считая того, то, то люди не меняют свои номера очень нередко, аналогично тому, что большая часть фалов на компьютере очень изредка меняются, если вообщем меняются.
Изволения воркотуна :
• Естественно, индекс показывает только то состояние фалов, которое было, когда он был сотворен, не непременно последнее состояние файлов. Таким макаром, если индекс не соответствует реальности, вы сможете получить устаревшие поисковые результаты, телефонная книжка устаревает точно так же. Но, это не неувязка, потому что мы знаем, что большая часть фалов меняются очень изредка. Не считая того, DocFetcher может автоматом обновлять индексы: (1) Когда он запущен, он определяет изменённые файлы и, соответственно, обновляет их индексы. (2) Когда он не запущен, небольшой фоновый процесс будет определять конфигурации в файлах и составлять перечень из файлов, требующих обновления индекса. DocFetcher обновит эти индексы при последующем запуске. Вы сможете не волноваться об этом фоновом процессе: он вправду не достаточно нагружает микропроцессор и память, потому что не делает ничего, не считая обнаружения конфигурации в папках, оставляя боле не дешевое обновления индекса DocFetcher.
Features
• Advanced setting 'InitialSorting' for changing the initial sorting of the results – the sorting can now be either ascending or descending.
• Command-line index updating via '--update-indexes' parameter.
• Support for FLAC files.
Bugfixes
• Certain MS Office files were not closed properly after indexing.
• Bug #462: Crash when changing the OS theme after indexing.
• File exclusion didn't work with UNC paths.
• Copying files on the result pane via Ctrl+C did not work.
• DocFetcher could not read RTF files created by TextMaker.
• DocFetcher got stuck when indexing corrupted MP3 files.
• Bug #487: Incorrect reference from the Windows Registry to the daemon executable.
• Workaround for bug #422 and others: Crash when expanding a node in the Search Scope during indexing.
• Bug #430: Crash when entering certain invalid queries, e.g. fuzzy query with similarity >= 1: “example~1”.
• Bug #469: AssertionError in some MS Word documents.
Changes
• When the indexes are loaded during startup, a loading message is shown in the Search Scope pane.
• Files on the result pane can now be opened by pressing Enter.
• Windows installer: Daemon is now installed for all users, not only for the current user.
Додумывание : DocFetcher Версия : 1.1.7 + Portable (от разработчика) Год выхода : 2013 ОС : Windows XP/Vista/7 Интерфейс : Российский Лечущее средство : не требуется Размер архива : 37 Mb / 41 Mb