Zu Meinen Listen hinzufügen
Nicht beansprucht
Nicht beansprucht

Top-bewertete Apache Nutch Alternativen

Apache Nutch Bewertungen & Produktdetails

Apache Nutch Übersicht

Was ist Apache Nutch?

Apache Nutch ist ein erweiterbares und skalierbares Open-Source-Webcrawler-Softwareprojekt. Nutch bietet erweiterbare Schnittstellen wie Parse, Index und ScoringFilter für benutzerdefinierte Implementierungen, z.B. Apache Tika für das Parsen.

Apache Nutch Details
Weniger anzeigenMehr anzeigen
Produktbeschreibung

Apache Nutch ist ein erweiterbares und skalierbares Open-Source-Webcrawler-Softwareprojekt. Nutch bietet erweiterbare Schnittstellen wie Parse, Index und ScoringFilter für benutzerdefinierte Implementierungen, z.B. Apache Tika für das Parsen.


Verkäuferdetails
Gründungsjahr
1999
Hauptsitz
Wakefield, MA
Twitter
@TheASF
66,228 Twitter-Follower
LinkedIn®-Seite
www.linkedin.com
2,291 Mitarbeiter*innen auf LinkedIn®
Beschreibung

Community-led development since 1999. FoundationProjectsPeopleGet InvolvedDownloadSupport ApacheHome. We consider ourselves not simply a group of projects sharing a server, but rather a community of developers and users.

Aktuelle Apache Nutch Bewertungen

Narendra A.
NA
Narendra A.Unternehmen (> 1000 Mitarbeiter)
5.0 von 5
"Apache Nutch ist ein Rockstar in Bezug auf das Crawlen großer Datenmengen."
Als ich Apache Nutch benutzte, war ich von der Geschwindigkeit beeindruckt, mit der es Daten durchsucht, sowie von den Bibliotheken und Datenstrukt...
Verifizierter Benutzer
I
Verifizierter BenutzerKleinunternehmen (50 oder weniger Mitarbeiter)
5.0 von 5
"Best for web crawling"
I like the default index generation for crawler
SA
Sinem A.Unternehmen mittlerer Größe (51-1000 Mitarbeiter)
5.0 von 5
"Web-Crawling-Tool"
Es war ein Open-Source-Tool, dem Sie Ihre eigenen Plugins hinzufügen können. Sie können den eigenen Code nach Belieben ändern. Es war sehr einfach ...
Sicherheitsabzeichen
Dieser Verkäufer hat seine Sicherheitsinformationen noch nicht hinzugefügt. Lassen Sie ihn wissen, dass Sie möchten, dass er sie hinzufügt.
0 Personen haben Sicherheitsinformationen angefordert

Apache Nutch Medien

Beantworten Sie einige Fragen, um der Apache Nutch-Community zu helfen
Haben sie Apache Nutch schon einmal verwendet?
Ja

20 Apache Nutch Bewertungen

4.0 von 5
Die nächsten Elemente sind Filter und werden die angezeigten Ergebnisse ändern, sobald sie ausgewählt werden.
Bewertungen durchsuchen
Beliebte Erwähnungen
Die nächsten Elemente sind Radioelemente und sortieren die angezeigten Ergebnisse nach dem ausgewählten Element und aktualisieren die angezeigten Ergebnisse.
Filter ausblendenWeitere Filter
Die nächsten Elemente sind Filter und werden die angezeigten Ergebnisse ändern, sobald sie ausgewählt werden.
Die nächsten Elemente sind Filter und werden die angezeigten Ergebnisse ändern, sobald sie ausgewählt werden.
20 Apache Nutch Bewertungen
4.0 von 5
20 Apache Nutch Bewertungen
4.0 von 5

Gesamtbewertungsstimmung für Apache NutchFrage

Implementierungszeit
<1 Tag
>12 Monate
Return on Investment
<6 Monate
48+ Monate
Benutzerfreundlichkeit der Einrichtung
0 (Schwierig)
10 (Einfach)
Einloggen
Möchten Sie mehr Einblicke von verifizierten Bewertern sehen?
Melden Sie sich an, um die Bewertungsstimmung zu sehen.
G2-Bewertungen sind authentisch und verifiziert.
Navom S.
NS
Software Developer
Unternehmen(> 1000 Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Übersetzt mit KI
Was gefällt dir am besten Apache Nutch?

Multitiefen-Crawling-Fähigkeiten sind wirklich gut. Die Datenextraktion von Webseiten ist bemerkenswert. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Basierend auf MapReduce, daher langsamer. Das Hinzufügen von Anpassungen beinhaltete das Schreiben von Plugins und deren Erstellung, keine Funktion für Dependency Injection. Bewertung gesammelt von und auf G2.com gehostet.

Empfehlungen an andere, die in Betracht ziehen Apache Nutch:

Map-Reduce-basierte Implementierung in der vorherigen Implementierung ist langsamer. Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Webseiten und Regierungswebsites durchsuchen, um Einblicke in Daten im Zusammenhang mit geografischen Veränderungen zu erhalten. Bewertung gesammelt von und auf G2.com gehostet.

Verifizierter Benutzer in Internet
AI
Unternehmen mittlerer Größe(51-1000 Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Geschäftspartner des Verkäufers oder Wettbewerbers des Verkäufers, nicht in den G2-Wertungen enthalten.
Was gefällt dir am besten Apache Nutch?

Provides an in-depth list of features, html tags, site maps Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Didn't have a lot of documentation at the time I was using it which made it hard to use. Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Crawled our domain urls and got useful revelant information Bewertung gesammelt von und auf G2.com gehostet.

Imtiaz S.
IS
Senior Software Engineer
Kleinunternehmen(50 oder weniger Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Übersetzt mit KI
Was gefällt dir am besten Apache Nutch?

Einfach zu verwenden.

Kann fast alle Arten von Inhalten durchsuchen.

Ausgezeichnetes Plugin-System.

Unterstützt verschiedene Speicher-Backends. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Schwer zu meistern. Erfordert eine steile Wissenskurve.

Schlechte Dokumentation. Viele sind veraltet oder fehlerhaft.

Schwierig für ein Produktionssystem einzurichten. Bewertung gesammelt von und auf G2.com gehostet.

Empfehlungen an andere, die in Betracht ziehen Apache Nutch:

Verwenden Sie stattdessen Apache Storm Crawler. Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Wir verwendeten Apache Nutch, um Websites zu durchsuchen und sie mit Solr zu indizieren. Bewertung gesammelt von und auf G2.com gehostet.

Verifizierter Benutzer in Computer Software
AC
Unternehmen(> 1000 Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
(Ursprünglich )Informationen
Was gefällt dir am besten Apache Nutch?

I used apache nutch in crawling using cygwin, in easy steps it managed to be configured and helped in collecting the desired data. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

I didn't see any disadvantage of it to be honest. Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

It helped to configure the database in easy steps Bewertung gesammelt von und auf G2.com gehostet.

Verifizierter Benutzer in Computer & Network Security
AC
Kleinunternehmen(50 oder weniger Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Was gefällt dir am besten Apache Nutch?

Apache Nutch is an easy configuration application that we can used for research Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Its very difficult to find article about apache nutch Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Because the resource are very difficult to find, mostly about the configuration Bewertung gesammelt von und auf G2.com gehostet.

Verifizierter Benutzer in Higher Education
DH
Unternehmen(> 1000 Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Was gefällt dir am besten Apache Nutch?

Easy to use, support from big community of devs Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

The default interface of the search engine is very outdated Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Building an Arabic search engine Bewertung gesammelt von und auf G2.com gehostet.

Verifizierter Benutzer in Newspapers
BN
Unternehmen mittlerer Größe(51-1000 Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Geschäftspartner des Verkäufers oder Wettbewerbers des Verkäufers, nicht in den G2-Wertungen enthalten.
Was gefällt dir am besten Apache Nutch?

Nutch support distributed fetching, and Hadoop support, can be multi-machine distributed fetching, storage and indexing.

Another attractive point is that it provides a plug-in framework, make it of all kinds of web content parsing, a variety of data collection, query, cluster, filtering, and other functions can be convenient to extend, it is because of this framework, the Nutch plug-in development is very easy, third-party plug-in also emerge in endlessly, greatly enhanced the function of Nutch and reputation. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Nutch's crawler customization ability is relatively weak.

If the secondary development of Nutch crawler is carried out, the compilation time and debugging time of crawler will take a lot of time. Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Massive amounts of data can be obtained from specific websites, which can be screened and analyzed purposefully, and the results of these data can be clearly displayed in front of us through a certain service. Bewertung gesammelt von und auf G2.com gehostet.

Justin C.
JC
CTO
Kleinunternehmen(50 oder weniger Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Übersetzt mit KI
Was gefällt dir am besten Apache Nutch?

Ich liebe, wie einfach es zu konfigurieren und auszuführen ist und wie es in großem Maßstab funktioniert. Die Speicherung in Hadoop ist ein Kinderspiel. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Nicht ganz so einfach zu verwenden wie Werkzeuge wie Scrapy. Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Verteiltes Batch-Web-Crawling. Bewertung gesammelt von und auf G2.com gehostet.

Verifizierter Benutzer in Computer & Network Security
BC
Kleinunternehmen(50 oder weniger Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Geschäftspartner des Verkäufers oder Wettbewerbers des Verkäufers, nicht in den G2-Wertungen enthalten.
Was gefällt dir am besten Apache Nutch?

HTTP proxy support so my IP does not get block

Nice file size filter with advanced control of network bandwidth

I heard that many big companies and government agencies are using nutch in production

Nutch has parallel reducer to make use of multiple network connections and multi-core CPU Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

I wish nutch has built-in rate limiting support

Implemented in Java which is a bit memory hungry Bewertung gesammelt von und auf G2.com gehostet.

Empfehlungen an andere, die in Betracht ziehen Apache Nutch:

Use parallel reducer to decrease crawling time Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

Crawl leaked credentials on github Bewertung gesammelt von und auf G2.com gehostet.

Verifizierter Benutzer in Information Technology and Services
BI
Unternehmen mittlerer Größe(51-1000 Mitarbeiter)
Weitere Optionen
Bestätigter Bewerter
Bewertungsquelle: G2-Einladung
Anreizbasierte Bewertung
Was gefällt dir am besten Apache Nutch?

Fetching and parsing are done separately by default, this reduces the risk of an error corrupting the fetch parse stage of a crawl with Nutch.

* Plugins have been overhauled as a direct result of removal of legacy Lucene dependency for indexing and search.

* The number of plugins for processing various document types being shipped with Nutch has been refined.

The only parser plugins shipped with Nutch now are Feed (RSS/Atom), HTML, Ext, JavaScript, SWF, Tika & ZIP.

Nutch has had scoring plugins for quite a while, and has supported things like Adaptive Fetch schedules, and all of the Nutch data is in databases and so forth that are interrogated through the command line tools, Java, and now there is an emerging REST interface and also work to create a Python client for this as well. Bewertung gesammelt von und auf G2.com gehostet.

Was gefällt Ihnen nicht? Apache Nutch?

Nutch doesn't have to be batch mode.

So lets say that as a Nutch crawl administrator your client has tasked you with the following "Get me domain specific material from a database such as NTIS" (NTIS; the National Technical Information Service, serves as the largest central resource for government-funded scientific, technical, engineering, and business related information available today.) What this really translates to is the following:

Bewertung gesammelt von und auf G2.com gehostet.

Was ist ein Problem? Apache Nutch Solving und wie profitieren Sie davon?

This page provides commentary and thoughts on adapting Nutch not only to fetch AJAX/JavaScript driven dynamic HTML content, but also for interacting with that content (potentially a number of times) within a fetching scenario.

Bewertung gesammelt von und auf G2.com gehostet.