Zu Meinen Listen hinzufügen
Nicht beansprucht
Nicht beansprucht

Top-bewertete Apache Nutch Alternativen

Apache Nutch Bewertungen & Produktdetails

Verifizierter Benutzer in Higher Education
DH
Unternehmen(> 1000 Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Was gefällt dir am besten Apache Nutch?

Easy to use, support from big community of devs Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

The default interface of the search engine is very outdated Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Building an Arabic search engine Bewertung gesammelt von und auf G2.com gehostet.

Apache Nutch Übersicht

Was ist Apache Nutch?

Apache Nutch ist ein erweiterbares und skalierbares Open-Source-Webcrawler-Softwareprojekt. Nutch bietet erweiterbare Schnittstellen wie Parse, Index und ScoringFilter für benutzerdefinierte Implementierungen, z.B. Apache Tika für das Parsen.

Apache Nutch Details
Weniger anzeigenMehr anzeigen
Produktbeschreibung

Apache Nutch ist ein erweiterbares und skalierbares Open-Source-Webcrawler-Softwareprojekt. Nutch bietet erweiterbare Schnittstellen wie Parse, Index und ScoringFilter für benutzerdefinierte Implementierungen, z.B. Apache Tika für das Parsen.


Verkäuferdetails
Gründungsjahr
1999
Hauptsitz
Wakefield, MA
Twitter
@TheASF
66,228 Twitter-Follower
LinkedIn®-Seite
www.linkedin.com
2,291 Mitarbeiter*innen auf LinkedIn®
Beschreibung

Community-led development since 1999. FoundationProjectsPeopleGet InvolvedDownloadSupport ApacheHome. We consider ourselves not simply a group of projects sharing a server, but rather a community of developers and users.

Aktuelle Apache Nutch Bewertungen

Narendra A.
NA
Narendra A.Unternehmen (> 1000 Mitarbeiter)
5.0 von 5
"Apache Nutch ist ein Rockstar in Bezug auf das Crawlen großer Datenmengen."
Als ich Apache Nutch benutzte, war ich von der Geschwindigkeit beeindruckt, mit der es Daten durchsucht, sowie von den Bibliotheken und Datenstrukt...
Verifizierter Benutzer
I
Verifizierter BenutzerKleinunternehmen (50 oder weniger Mitarbeiter)
5.0 von 5
"Best for web crawling"
I like the default index generation for crawler
SA
Sinem A.Unternehmen mittlerer Größe (51-1000 Mitarbeiter)
5.0 von 5
"Web-Crawling-Tool"
Es war ein Open-Source-Tool, dem Sie Ihre eigenen Plugins hinzufügen können. Sie können den eigenen Code nach Belieben ändern. Es war sehr einfach ...
Sicherheitsabzeichen
Dieser Verkäufer hat seine Sicherheitsinformationen noch nicht hinzugefügt. Lassen Sie ihn wissen, dass Sie möchten, dass er sie hinzufügt.
0 Personen haben Sicherheitsinformationen angefordert

Apache Nutch Medien

Beantworten Sie einige Fragen, um der Apache Nutch-Community zu helfen
Haben sie Apache Nutch schon einmal verwendet?
Ja

19 von 20 Gesamtbewertungen für Apache Nutch

4.0 von 5
Die nächsten Elemente sind Filter und werden die angezeigten Ergebnisse ändern, sobald sie ausgewählt werden.
Bewertungen durchsuchen
Beliebte Erwähnungen
Die nächsten Elemente sind Radioelemente und sortieren die angezeigten Ergebnisse nach dem ausgewählten Element und aktualisieren die angezeigten Ergebnisse.
Filter ausblendenWeitere Filter
Die nächsten Elemente sind Filter und werden die angezeigten Ergebnisse ändern, sobald sie ausgewählt werden.
Die nächsten Elemente sind Filter und werden die angezeigten Ergebnisse ändern, sobald sie ausgewählt werden.

Gesamtbewertungsstimmung für Apache NutchFrage

Implementierungszeit
<1 Tag
>12 Monate
Return on Investment
<6 Monate
48+ Monate
Benutzerfreundlichkeit der Einrichtung
0 (Schwierig)
10 (Einfach)
Einloggen
Möchten Sie mehr Einblicke von verifizierten Bewertern sehen?
Melden Sie sich an, um die Bewertungsstimmung zu sehen.
G2-Bewertungen sind authentisch und verifiziert.
Narendra A.
NA
Senior Software Engineer
Unternehmen(> 1000 Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Übersetzt mit KI
(Ursprünglich )Informationen
Was gefällt dir am besten Apache Nutch?

Als ich Apache Nutch benutzte, war ich von der Geschwindigkeit beeindruckt, mit der es Daten durchsucht, sowie von den Bibliotheken und Datenstrukturen, die zur Anpassung des Crawlings und zum Lesen der Daten im gewünschten Format bereitgestellt werden. Ich durchsuchte die gesamten IBM-Daten, um Erkenntnisse zu gewinnen und Textanalysen durchzuführen. Die Unterstützung, die ich von den Foren erhielt, war ebenfalls großartig. Insgesamt war es also eine schöne Erfahrung, den Apache Nutch Crawler zu verwenden. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Was mir nicht gefiel, war die Video-Unterstützung, die es im Internet bietet. Bewertung gesammelt von und auf G2.com gehostet.

Empfehlungen an andere, die in Betracht ziehen Apache Nutch:

Es ist schön zu verwenden und bietet viel Flexibilität. Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Ich löste das Problem in meiner Organisation für Datenanalyse. Wo wir den gesamten Prozess des Bietens mit Textanalyse automatisieren. Bewertung gesammelt von und auf G2.com gehostet.

Jaydip L.
JL
Senior Software Engineer
Kleinunternehmen(50 oder weniger Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Übersetzt mit KI
Was gefällt dir am besten Apache Nutch?

Open Source

Skalierbar

Parsing- und Indexierungstechniken.

Einfache Integration mit Elasticsearch und Solr.

Verschiedene Plugins zum Parsen verschiedener Inhaltstypen. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Nicht viel auf meiner Liste der Abneigungen, weil wir es wirklich sehr genossen haben und es unsere organisatorischen Bedürfnisse erfüllt hat. Aber basierend auf Erfahrung kann ich einige Nachteile nennen, wie dass es eine gute Infrastruktur erfordert und eine beträchtliche Menge an Speicher und CPU-Auslastung verbraucht. Wir haben auch das Gefühl, dass es sehr hilfreich für uns wäre, wenn Nutch ein gutes Dashboard und eine Art Admin-Panel bereitstellen würde. Bewertung gesammelt von und auf G2.com gehostet.

Empfehlungen an andere, die in Betracht ziehen Apache Nutch:

Als wir Anforderungen für das Crawling hatten, haben wir verschiedene Tools wie StormCrawler, Scrapy usw. verwendet. Aber wir fanden dieses Tool als sehr zuverlässig und vor allem Open Source. Seine verschiedenen Funktionen wie automatisches Crawling, das Finden von inneren Links zum Crawlen, das Parsen verschiedener Arten von Inhalten, verschiedene Integrationen usw. haben uns dazu gebracht, dieses Tool zu wählen, und glauben Sie mir, wir haben es nie bereut, es zu verwenden. Bestes Crawling-Tool. Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Unser Geschäftsbedarf besteht darin, eine Suchmaschine zu entwickeln, bei der wir eine Liste von URLs an Nutch übergeben und es alle diese URLs sowie deren innere URLs crawlen wird. Wir speicherten diese gecrawlten Daten in einer Cassandra-Datenbank und dann war Elasticsearch im Einsatz, um unsere Suchanfragen zu erfüllen. Dies funktionierte tatsächlich perfekt und Nutch half uns wirklich, das Crawlen mit seinen Fähigkeiten zum Parsen verschiedener Inhaltstypen und zum Speichern zu ermöglichen. Bewertung gesammelt von und auf G2.com gehostet.

SA
Quality Assurance Test Engineer
Unternehmen mittlerer Größe(51-1000 Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: Verkäufer einladen
Übersetzt mit KI
Was gefällt dir am besten Apache Nutch?

Es war ein Open-Source-Tool, dem Sie Ihre eigenen Plugins hinzufügen können. Sie können den eigenen Code nach Belieben ändern. Es war sehr einfach zu bedienen. Es kann auch mit verschiedenen Tools ausgeführt werden. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Sie sollten wissen, welche Version von Nutch für andere Werkzeuge geeignet ist, mit denen Sie arbeiten. Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Ich habe es verwendet, während ich meine Abschlussarbeit schrieb, um türkische Webseiten für meinen verbesserten Suchmaschinenalgorithmus zu durchsuchen. Außerdem habe ich es bei der Arbeit in einem türkischen Suchmaschinenprojekt verwendet. Bewertung gesammelt von und auf G2.com gehostet.

Naser A.
NA
Research Officer
Unternehmen mittlerer Größe(51-1000 Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Übersetzt mit KI
Geschäftspartner des Verkäufers oder Wettbewerbers des Verkäufers, nicht in den G2-Wertungen enthalten.
Was gefällt dir am besten Apache Nutch?

Ich benutze Apache Nutch seit 3 oder 4 Jahren, ich mag es als Open-Source-Tool, das auf einem System mit normalen Spezifikationen laufen kann und Millionen von Seiten crawlen kann. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

* Ich mag seinen Algorithmus zur Erstellung von Seeds nicht, er bildet Cluster und geht dann in eine Schleife, um dieselben Websites zu durchsuchen, wenn er Millionen von Seiten durchsucht hat.

* Seine Konfiguration ist nicht einfach.

* Dokumentation ist nicht gut.

* Support ist nicht gut. Bewertung gesammelt von und auf G2.com gehostet.

Empfehlungen an andere, die in Betracht ziehen Apache Nutch:

Nicht einfach in den frühen Tagen, aber sobald es eingerichtet ist, übertrifft es Ihre Erwartungen. Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Ich habe eine große Anzahl von Websites abgerufen, die spezifische Sprache enthalten, um eine lokale Suchmaschine zu erstellen. Bewertung gesammelt von und auf G2.com gehostet.

Prafulla R.
PR
Technical Architect
Kleinunternehmen(50 oder weniger Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Übersetzt mit KI
Was gefällt dir am besten Apache Nutch?

-Einfach zu konfigurieren

-Stabiler Backend-Speicher Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Die Verwendung von Java macht es etwas sperrig. Man muss auf die Heap-Größe achten, sonst sind OOM-Fehler unvermeidlich. Bewertung gesammelt von und auf G2.com gehostet.

Empfehlungen an andere, die in Betracht ziehen Apache Nutch:

Seien Sie vorsichtig mit der Heap-Größeneinstellung in der Konfigurationsdatei. Verwenden Sie HBase wie einen NoSQL-Datenspeicher, um gecrawlte Daten zu speichern. Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Implementierung einer eCommerce-Produktvergleichsmaschine.

Nutch ermöglicht das Crawlen von Daten auf ethische Weise. Bewertung gesammelt von und auf G2.com gehostet.

Krishnan S.
KS
Software Engineer
Unternehmen mittlerer Größe(51-1000 Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Übersetzt mit KI
Was gefällt dir am besten Apache Nutch?

Crawl von URL ist eine ausgezeichnete Funktion, um den Inhalt zu lesen. Nutch ist ein sehr nützliches Werkzeug, um den Inhalt im Dokument in verschiedenen Tiefen zu lesen. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Etwas schwierig, die Crawl-Funktion anzupassen. Bewertung gesammelt von und auf G2.com gehostet.

Empfehlungen an andere, die in Betracht ziehen Apache Nutch:

Sehr schönes Werkzeug zu verwenden. Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Den Inhalt für die Suchmaschine für eine statische Webseite vorbereitet. Bewertung gesammelt von und auf G2.com gehostet.

Ruchika J.
RJ
Hadoop Developer
Kleinunternehmen(50 oder weniger Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Übersetzt mit KI
Geschäftspartner des Verkäufers oder Wettbewerbers des Verkäufers, nicht in den G2-Wertungen enthalten.
Was gefällt dir am besten Apache Nutch?

Plugins für Indizierung und Suche.

Integration mit Solar und anderen Tools.

Es funktioniert auch gut in Hadoop-Clustern. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Mangel an Gemeinschaft, um über ein beliebiges Problem oder Anliegen zu diskutieren.

Mangel an Dokumenten für die Implementierung und Integration von Nutch. Bewertung gesammelt von und auf G2.com gehostet.

Empfehlungen an andere, die in Betracht ziehen Apache Nutch:

Für Web-Crawling und Data-Mining können Sie Nutch problemlos mit anderen Big-Data-Technologien implementieren. Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Daten aus XML-Daten von URLs crawlen und parsen. Apache Tika wird zum Parsen verwendet, Daten von Solar indiziert und gefiltert und ein SEO-Tool sowie ein PPC-Tool erstellt. Ich habe domänenspezifische Materialien, aber es hat keinen Batch-Modus. Es funktioniert gut auf Clustern. Bewertung gesammelt von und auf G2.com gehostet.

Usama T.
UT
Python Developer
Unternehmen mittlerer Größe(51-1000 Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Übersetzt mit KI
Was gefällt dir am besten Apache Nutch?

Seine Funktion, das gesamte Web mit internen und externen Links zu durchsuchen, was es zu einem unendlichen Crawling macht. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Wir müssen ein sehr starkes Wissen über Apache Hadoop, Hbase, Zookeeper und die vollständige Einrichtung der Umgebung haben. Wir müssen darin sehr effizient sein, um dies zu nutzen. Außerdem können wir Hbase-Daten nicht leicht einsehen, was ebenfalls sehr schwierig ist. Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Ich arbeite an einer Suchmaschine und dafür ist Crawling das grundlegende Bedürfnis, das ich durch Apache Nutch erhalte. Ich kann vollständige Webdaten crawlen, indem ich einige Links bereitstelle und es durch In-Links und Out-Links crawlen lasse. Bewertung gesammelt von und auf G2.com gehostet.

Fred Z.
FZ
Founder
Unternehmen(> 1000 Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Übersetzt mit KI
Was gefällt dir am besten Apache Nutch?

Ich habe Nutch mehrmals eingesetzt, wenn ich schnell einen Crawler aufstellen musste. Es ist kostenlos, unkompliziert, zuverlässig, gut dokumentiert und kommt mit einer OTS-Integration mit Apache Solr für die Suche. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Das Verzeichnis- und Dateipartitionierungsschema für den Crawler kann etwas verwirrend sein. Bewertung gesammelt von und auf G2.com gehostet.

Empfehlungen an andere, die in Betracht ziehen Apache Nutch:

betrachten Sie die Google Programmable Search Engine Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Es ist eine ausgezeichnete Lösung, wenn Sie einen schnellen, einfachen, kostenlosen Crawler benötigen. Bewertung gesammelt von und auf G2.com gehostet.

Verifizierter Benutzer in Pharmaceuticals
IP
Kleinunternehmen(50 oder weniger Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Geschäftspartner des Verkäufers oder Wettbewerbers des Verkäufers, nicht in den G2-Wertungen enthalten.
Was gefällt dir am besten Apache Nutch?

I like the default index generation for crawler Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

When working with Ubuntu OS I find hard to setting the directory paths Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

I have successfully integrated Apache Nutch to Hadoop and hive eco systems and sets the rule based contents in the web pages Bewertung gesammelt von und auf G2.com gehostet.