MySQLDumper-Board Forum Index Follow me on Twitter

Portal  •   Forum  •  Downloads  •  Profile  •  Search   •  Register  •  Log in to check your private messages  •  Log in  •  


 Feature Request: Google Bots zerstört die Datenbank --> Fix:

Post new topicReply to topic
Author Message
a7
knows MySQLDumper
knows MySQLDumper





Joined: 04 Jan 2010
Posts: 6


blank.gif

PostPosted: 2010-01-04, 13:58    Feature Request: Google Bots zerstört die Datenbank --> Fix: Reply with quoteBack to top

Gestern Nacht habe ich mal wieder mit dem msd gearbeitet als ich eine Seite auf einen anderen Server umgezogen habe und alles hat wie gehabt gut funktioniert. Msd per wget ziehen, installieren, backup einspielen. Nur (ich schiebe es mal auf die späte Stunde) habe ich diesmal vergessen ein .htpasswd zu setzen, mit gravierenden Folgen:

Heute morgen gehen die Seiten nicht mehr und die Datenbank ist völlig wahllos verhackstückelt, Daten Fehlen, Tabellen haben weniger Spalten…

To make a long story short:
Google hat, über einen Link in Gmail oder das Firefox Pagerank Plugin von der Adresse des msd Wind bekommen und ist einfach jedem Link gefolgt was zu den verrücktesten Fehlern und zu einer leichten Überlastung des Servers geführt hat. Tausende Logeinträge in der Art: sql.php?db=web72db1&tablename=xtca_webform_submissions&dbid=0&order=&orderdir=&limitstart=0&sql_statement=SELECT+*+FROM+%60xtca_webform_submissions%60&tdc=1

Ich für mich konnte den Spuk jetzt beenden, aber der Fehler wird bei irgend jemand irgendwann wieder auftreten, da dem ein oder anderem evtl. nicht mal klar ist, dass es ein pwd setzen sollte und Menschen eben dazu neigen Dinge zu vergessen. Daher sollte man unbedingt am besten zwei Features einbauen:

    * Einrichtung des .htpasswd Schutzes während des Installationsprozesses in dem man explizit auswählen muss, dass man keinen Passwort Schutz möchte.
    * <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> auf Seiten


Alternativ könnte man natürlich auch js oder .htaccess einsetzen oder nach dem User Agent fragen, aber die kombination aus den genannten Punkten dürfte denke ich ausreichen.

HiddenView user's profileSend private message    
Anzeigen











Posted:    Anzeigen Back to top


    
DSB
Developer
Developer




Age: 41
Joined: 30 Apr 2004
Posts: 16067
Location: Reichenberg bei Würzburg


germany.gif

PostPosted: 2010-01-04, 16:28    (No subject) Reply with quoteBack to top

Ich habe das mal in "Feature Requests" verschoben und halte das mal im Hinterkopf.
Die ein oder Sache kann man da bestimmt machen.

Danke für die Anregung.

_________________
Gruß / Greetings, DSB

Teigwaren heißen Teigwaren, weil sie Teig waren.
Diejenigen, die lautstark darüber diskutieren, warum es nicht geht, mögen bitte jene nicht stören, die es gerade tun.

OfflineView user's profileSend private messageSend e-mailVisit poster's website    
StvN
Developer
Developer




Age: 21
Joined: 19 Dec 2008
Posts: 167
Location: Potsdam


germany.gif

PostPosted: 2010-01-05, 01:53    (No subject) Reply with quoteBack to top

Man müsste einfach in einer robots.txt das ganze für Bots verbieten "Disallow".
Es ist nicht nötig ein META-Tag dafür zu setzen

Die guten Bots fragen die robots.txt von alleine ab.

_________________
Jag är lat
Bitte stellt keine Meta-Fragen!

follow me on twitter

OfflineView user's profileSend private messageVisit poster's website    
a7
knows MySQLDumper
knows MySQLDumper





Joined: 04 Jan 2010
Posts: 6


blank.gif

PostPosted: 2010-01-05, 01:55    (No subject) Reply with quoteBack to top

« DSB » wrote:
Ich habe das mal in "Feature Requests" verschoben und halte das mal im Hinterkopf.
Die ein oder Sache kann man da bestimmt machen.

Danke für die Anregung.


Ups, nach dem Forum hatte ich nur unter Fehler gesucht Wink

Danke für dein Feedback und Deine Arbeit am msd.

Bzgl robots.txt - die wird afaik nur im Website root nachgefragt auf welches der msd idR keinen Zugriff hat - Die Vorgeschlagene Funktion soll Nutzer ja automatisch schützen um Menschliche Fehler nicht im Desaster Enden zu lassen. Eine Alternative wäre da eher Links per nofollow oder js einzusetzen aber da finde ich den meta tag noch von allen Möglichkeiten am besten. Ein Tag an der Stelle macht auch für die Webseiten Ladegeschwindigkeit null Unterschied.

HiddenView user's profileSend private message    
JayD
Moderator
Moderator




Age: 50
Joined: 12 Apr 2009
Posts: 1017
Location: Ruhrgebiet


germany.gif

PostPosted: 2010-01-06, 02:48    (No subject) Reply with quoteBack to top

« StvN » wrote:
Man müsste einfach in einer robots.txt das ganze für Bots verbieten "Disallow".
Es ist nicht nötig ein META-Tag dafür zu setzen


Die guten Bots fragen die robots.txt von alleine ab.


Das ist so nicht ganz richtig. Wink

Eine robots.txt ist keineswegs irgendein "Schutz", lediglich eine Art "Empfehlung" und der dezente Hinweis, das man dies und jenes nicht wünscht.

"Verbieten" kannst damit nicht wirklich etwas, auch wenn es die Übersetzung vermuten lässt.
Es ersetzt weder eine .htaccess noch sonstige Schutz-Einrichtungen, sondern ist lediglich eine Art "Regelwerk", was man möchte und was nicht.

Zwar ist es so, dass "seriöse" SuMa/Bots/Crawler sich "freundlicherweise" an eine robots.txt halten, sofern sie denn existiert, aber "technisch verbindlich" ist sei keineswegs und ersetzt auch nichts an Schutz-Maßnahmen.
Es gibt genug Bots/SuMa, die drauf pfeifen und sich großflächig über diese TXT hinwegsetzen und trotzdem überall "schnüffeln".

Ich weiß, dass dieser Denkfehler sehr häufig (selbst unter Web-Admins) gemacht wird und zu Verwirrung führt, aber gerade deswegen muss man explizit darauf hinweisen, sich nicht alleinig auf diese (simpele Textdatei) zu verlassen.
Wirklich "steuern" kann man sie damit im Zweifelsfall zumindest nicht.

Über Rechtevergabe kann man z.B. in Foren recht viel machen, indem man SuMa nicht nur Gastrechte einräumt, sondern diese im Zweifelsfall (über eine eigene Bot-Gruppe) noch weiter eingrenzt.
Zwar können sie vorhandene Links innerhalb einer Domain dann immer noch indexieren, deren Inhalte aber dann mangels Zugriff nicht mehr für sich auswerten und "sinnvoll" verwenden.

Umgekehrt ist es aber gerade auch so, dass Meta-TAGs immer mehr an Bedeutung verlieren. Gerade Google achtet seit längerer Zeit fast gar nicht mehr darauf, einfach weil damit in der Vergangenheit viel zu viel Mißbrauch getrieben wurde, gepushte Rankings erreicht wurden usw usw.

In der Folge irgendwelcher "SEO-Maßnahmen" usw. stehen sie bei Google inzwischen ziemlich weit unten, das wird häufig überschätzt heutzutage.


//PS:
Quote:
Bzgl robots.txt - die wird afaik nur im Website root nachgefragt auf welches der msd idR keinen Zugriff hat -


Auch nicht ganz richtig. Wink Du kannst eine robots.txt auch zusätzlich im nächst-höheren Verzeichnis anlegen. Sie wird dann im Normalfall ebenso berücksichtigt und abgefragt (aber eben nicht von allen Bots).
Das kann man sich aber auch ersparen, wenn man alle Ein/Ausschlüsse/Pfade/Ordner usw. direkt schon in der TXT, welche im Web-Root liegt, angibt. Smile

_________________
Gruß,
Jörg


Anfragen zu vBulletin, welche nichts mit Datenbanken bzw. dem Dumper zu tun haben, bitte nicht hier sondern im vBulletin-Support-Forum stellen.

Aus technischen Gründen befindet sich der Rest der Signatur auf der Rückseite dieses Beitrags.

OfflineView user's profileSend private message    
DSB
Developer
Developer




Age: 41
Joined: 30 Apr 2004
Posts: 16067
Location: Reichenberg bei Würzburg


germany.gif

PostPosted: 2010-01-06, 02:58    (No subject) Reply with quoteBack to top

« JayD » wrote:
Umgekehrt ist es aber gerade auch so, dass Meta-TAGs immer mehr an Bedeutung verlieren. Gerade Google achtet seit längerer Zeit fast gar nicht mehr darauf, einfach weil damit in der Vergangenheit viel zu viel Mißbrauch getrieben wurde, gepushte Rankings erreicht wurden usw usw.

Dies gilt aber nur für die Tags mit denen Mißbrauch betrieben wurde (description, keywords, usw.). Die Standardtags wie NOINDEX und NOFOLLOW werden nach wie vor ganz normal beachtet. Insofern bietet sich das hier als schnelle Lösung an. Wink

_________________
Gruß / Greetings, DSB

Teigwaren heißen Teigwaren, weil sie Teig waren.
Diejenigen, die lautstark darüber diskutieren, warum es nicht geht, mögen bitte jene nicht stören, die es gerade tun.

OfflineView user's profileSend private messageSend e-mailVisit poster's website    
StvN
Developer
Developer




Age: 21
Joined: 19 Dec 2008
Posts: 167
Location: Potsdam


germany.gif

PostPosted: 2010-01-06, 10:32    (No subject) Reply with quoteBack to top

Quote:
Zwar ist es so, dass "seriöse" SuMa/Bots/Crawler sich "freundlicherweise" an eine robots.txt halten, sofern sie denn existiert, aber "technisch verbindlich" ist sei keineswegs und ersetzt auch nichts an Schutz-Maßnahmen.
Es gibt genug Bots/SuMa, die drauf pfeifen und sich großflächig über diese TXT hinwegsetzen und trotzdem überall "schnüffeln".


Genau das hab ich doch geschrieben, nagut ich hab das kleine Wörtchen "meist" vergessen. xD
Aber danke für die Umschreibung.

BTW.: Dieses Feature ist gerade erfolgreich in der Entwicklerversion eingegangen, dank Daniel. :-)

_________________
Jag är lat
Bitte stellt keine Meta-Fragen!

follow me on twitter

OfflineView user's profileSend private messageVisit poster's website    
DSB
Developer
Developer




Age: 41
Joined: 30 Apr 2004
Posts: 16067
Location: Reichenberg bei Würzburg


germany.gif

PostPosted: 2010-01-06, 11:06    (No subject) Reply with quoteBack to top

Bevor ich das wieder vergesse... Wink
_________________
Gruß / Greetings, DSB

Teigwaren heißen Teigwaren, weil sie Teig waren.
Diejenigen, die lautstark darüber diskutieren, warum es nicht geht, mögen bitte jene nicht stören, die es gerade tun.

OfflineView user's profileSend private messageSend e-mailVisit poster's website    
a7
knows MySQLDumper
knows MySQLDumper





Joined: 04 Jan 2010
Posts: 6


blank.gif

PostPosted: 2010-01-07, 01:50    (No subject) Reply with quoteBack to top

Also das robots in jedem theoretischen Ordner nach einer robots.txt schauen halte ich für ein Grücht - was glaubst Du wie voll mit 404 Fehlern die Logs von wordpress blogs und anderen Systemen mit SEF-URLs wären. Wink

Klasse, dass es so schnell geklappt hat!

Die Implementierung eines Passwortschutzes in den Installationsprozess sollte man denke ich aber auf jeden Fall auch voran treiben - alternativ wäre auch ein Usermanagement mit Login eine Lösung. Das wäre vor allem auch dahingehend interessant wenn man Entwicklern zugriff auf einzelne Datenbanken geben möchte, nicht aber auf alle über einen Server verwaltete.

Zur Verdeutlichung der Wichtigkeit schaue man sich einfach mal den Wikipedia Artikel zu Google Hacking an und überlege sich eine Query für Google - ich bin mir sicher jeder kommt auf verschiedene Querys die jeweils viele Seiten liefern mit einem nicht geschützten Mysqldumper bzw Seiten die offensichtlich schon mal einen Mysqldumper ohne Passwortschutz installiert hatten. Mich hat es keine 30 Sekunden gebraucht nicht passwort geschützte Seiten zu finden, vermutlich hunderte.

Mit zunehmener Bekanntheit wird eine Software auch zunehmend für Scribt Kiddies und Malware Programmierer interessant...

HiddenView user's profileSend private message    
DSB
Developer
Developer




Age: 41
Joined: 30 Apr 2004
Posts: 16067
Location: Reichenberg bei Würzburg


germany.gif

PostPosted: 2010-01-07, 02:15    (No subject) Reply with quoteBack to top

« a7 » wrote:
Klasse, dass es so schnell geklappt hat!

In der aktuellen Entwicklerversion ist das nun implementiert. Beim nächsten Release ist das also drin.

Quote:
Das wäre vor allem auch dahingehend interessant wenn man Entwicklern zugriff auf einzelne Datenbanken geben möchte, nicht aber auf alle über einen Server verwaltete.

Einen klitzekleinen Moment. Das Einsatzgebiet, was Du hier andenkst geht weit über das ursprüngliche Einsatzgebiet des Dumpers hinaus und klingt eher nach einer kommerziellen Lösung. Bisher ist MySQLDumper eine einfache Möglichkeit für einen einzelnen Admin seine eigenen Datenbanken zu sichern, zu editieren oder Backups wieder einzuspielen. Eine Mehruserfähigkeit besitzt er nicht.

Quote:
Zur Verdeutlichung der Wichtigkeit schaue man sich einfach mal den Wikipedia Artikel zu Google Hacking an und überlege sich eine Query für Google - ich bin mir sicher jeder kommt auf verschiedene Querys die jeweils viele Seiten liefern mit einem nicht geschützten Mysqldumper bzw Seiten die offensichtlich schon mal einen Mysqldumper ohne Passwortschutz installiert hatten.

Ich sehe hier keinen dringenden Handlungsbedarf. Der Dumper weist direkt auf der Startseite auf einen fehlenden Verzeichnisschutz hin. Wer das ignoriert ist selbst schuld und unbelehrbar. Zusätzlich habe ich ein ausführliches Video-Tutorial zum Verzeichnisschutz gemacht und auch hier im Forum in der FAQ findet man einen ausführlichen Artikel. Wer sich dazu informieren möchte, hat hier alle Möglichkeiten dazu. Es ist nicht die Aufgabe des Dumpers einen "Admin" dazu zu zwingen den Schutz anzulegen.
Ebenfalls ist eine automatische Erstellung problematisch, da es viele Server mit unterschiedlichen Voraussetzungen gibt. Nicht jeder kann eigene htaccess-Dateien nutzen. Dafür bieten einem die Hoster aber die Möglichkeit einen Schutz zu erstellen - das kann technisch nicht von MySQLDumper übernommen werden. Eine Zwangsanlegung einer htaccess würde dazu führen, dass viele Anwender danach nicht in den Dumper kommen und scheidet damit aus. Der Admin muss wissen wie sein Space funktioniert.
Die Gedanken habe ich natürlich alle schon gehabt. Ein automatisches Anlegen einer htaccess-Datei ist leider problematisch und kann nicht automatisiert werden. Wenn es problemlos ginge, hätte der Dumper das bereits. Wink

_________________
Gruß / Greetings, DSB

Teigwaren heißen Teigwaren, weil sie Teig waren.
Diejenigen, die lautstark darüber diskutieren, warum es nicht geht, mögen bitte jene nicht stören, die es gerade tun.

OfflineView user's profileSend private messageSend e-mailVisit poster's website    
JayD
Moderator
Moderator




Age: 50
Joined: 12 Apr 2009
Posts: 1017
Location: Ruhrgebiet


germany.gif

PostPosted: 2010-01-07, 05:26    (No subject) Reply with quoteBack to top

« a7 » wrote:
Also das robots in jedem theoretischen Ordner nach einer robots.txt schauen halte ich für ein Grücht -


Ja sorry, das muss ich tatsächlich korrigieren. Du hast Recht.
Habe grad extra nochmal geguckt und das hatte ich falsch in Erinnerung.
Anders als eine .htaccess wird sie tatsächlich nur im Web-Root einer Domain gesucht und muss demzufolge auch da liegen. Smile

_________________
Gruß,
Jörg


Anfragen zu vBulletin, welche nichts mit Datenbanken bzw. dem Dumper zu tun haben, bitte nicht hier sondern im vBulletin-Support-Forum stellen.

Aus technischen Gründen befindet sich der Rest der Signatur auf der Rückseite dieses Beitrags.

OfflineView user's profileSend private message    
a7
knows MySQLDumper
knows MySQLDumper





Joined: 04 Jan 2010
Posts: 6


blank.gif

PostPosted: 2010-01-07, 13:17    (No subject) Reply with quoteBack to top

Mir ist klar dass diese Funktion aktuell nicht implementiert ist und ich möchte auf keinen Fall das etwas in die Richtung "Ich will!", "Mach das!" oder "Das fehlt!" sagen - nur "Das wäre doch eine schöne Funktion".

Mein Vorschlag ist nicht, dass die .htaccess automatisch und zwingend erstellt wird, sondern nur dass der Hinweis mit der optionalen Erstellfunktion am Ende der installation erscheint und zwar noch bevor das Menü links angezeigt wird. So würde der Fokus des Anwenders zwangsweise darauf fallen und ein Übersehen wäre quasi ausgeschlossen.
Von der Anwendung ins eigene Verzeichnis geschriebene Daten sind immer kritisch - bei .htacces ganz besonders weil im zweifelsfal nur noch ein 500er Fehler erscheint, aber auch aus sicherheitstechnischen Aspekten und weil je nach Webserverkonfiguration von php angelegte Dateien nicht mehr vom user gelöscht werden können.
Hierzu noch eine Anmerkung: Drupal wird z.B. mit einer .htaccess Datei ausgeliefert die manche evtl vorhandene Schwachstellen des Servers durch vorgefertigte .htaccess Regeln schließt. http://ftp.drupal.org/files/projects/drupal-6.x-dev.tar.gz Das aber nur am Rande.


Quote:
Ich sehe hier keinen dringenden Handlungsbedarf. Der Dumper weist direkt auf der Startseite auf einen fehlenden Verzeichnisschutz hin. Wer das ignoriert ist selbst schuld und unbelehrbar.

Dringend ist relativ. Smile
Ja wer lesen kann ist klar im Vorteil und ich war selbst schuld, dass ich in dem Moment nicht daran gedacht habe, keine Frage.
Trotzdem möchtet ihr bestimmt die Software so sicher wie möglich machen und die meisten Fehler sitzen nun mal vor dem Rechner und müssen leider mit bedacht werden Wink
Sollte das Argument nicht überzeugen, dann denkt einfach daran, dass Mysqldumper dazu verwendet werden wird Webserver zu hacken um darüber Spam zu versenden, Trojander zu verteilen, ... und darunter leiden wir alle die wir das Internet nutzen. In diesem Sinne - Keine Panik, aber reagieren sollte man denke ich.

HiddenView user's profileSend private message    
Display posts from previous:      
Post new topicReply to topic


 Jump to:   


Show permissions
Similar topics
Topic Author Forum Replies Posted
No new posts oTranCe Feature-Request: Platzhalter-... HolgerGremminger OTC - Feature requests 0 2012-05-18, 14:31 View latest post
No new posts oTranCe Feature-Request: Terminologie... HolgerGremminger OTC - Feature requests 0 2012-05-18, 14:18 View latest post
No new posts oTranCe Feature-Request: Save and nex... HolgerGremminger Implemented Features 4 2012-05-18, 14:12 View latest post
No new posts Error beim wiederherstellen der Daten... nefertia Errors and questions 4 2012-03-28, 18:59 View latest post
No new posts Perl: Eine Datenbank wird übersprungen Vee Fehler / Probleme 1 2012-03-28, 07:57 View latest post

 
CrackerTracker © 2004 - 2012 CBACK.de

Powered by Orion based on phpBB © 2001, 2002 phpBB Group
CBACK Orion Style based on FI Theme
All times are GMT + 2 Hours

phpBB SEO