15 Novembre 2023

Google Aggiunge Nuova Documentazione per un Crawler Misterioso

Google ha aggiornato la lista dei suoi crawler ufficiali aggiungendo informazioni per un crawler sconosciuto.

Google Safety User Agent

Google ha aggiornato la lista dei suoi crawler ufficiali aggiungendo il nome e le informazioni per un crawler relativamente sconosciuto che gli editori hanno visto di tanto in tanto, ma per il quale non esisteva alcuna documentazione fino ad oggi.

Sebbene Google abbia aggiunto una documentazione ufficiale per questo crawler, le informazioni fornite sembrano incoraggiare ulteriori chiarimenti.

Crawler Speciali Google dispone di diversi tipi di crawler (noti anche come bot e spider).

Le diverse forme di crawler includono:

  1. Crawler Comuni Questi bot vengono principalmente utilizzati per l’indicizzazione di diversi tipi di contenuti. Tuttavia, alcuni crawler comuni sono utilizzati anche per strumenti di test di ricerca, per uso interno del team di prodotto di Google e per il crawling legato all’intelligenza artificiale.
  2. Fetcher Triggerati dagli Utenti Si tratta di bot attivati dagli utenti. Questo include utilizzi come il recupero di feed o la verifica del sito.
  3. Crawler Speciali Questi sono per casi speciali come il controllo della qualità delle pagine di annunci mobile o per i messaggi di notifica push tramite le API di Google. Questi bot non rispettano le direttive globali degli utenti nel file robots.txt che sono segnalati con l’asterisco (*).

La nuova documentazione riguarda lo User Agent Google-Safety. Il crawler non è nuovo, ma la documentazione lo è.

Google-Safety Crawler La documentazione relativa al crawler Google-Safety nella categoria dei Crawler Speciali è utilizzata dai processi di Google per individuare il malware.

In modo unico tra i Crawler Speciali, il Google-Safety Crawler ignora completamente tutte le direttive del file robots.txt.

Ecco cosa dice la nuova documentazione per il Google-Safety Crawler:

Lo user agent Google-Safety gestisce il crawling specifico per la segnalazione di abusi, come la scoperta di malware per i link pubblicamente disponibili su proprietà Google.
Questo agente utente ignora le regole del file robots.txt.

 

Hai dei dubbi? Non sai da dove iniziare? Contattaci !

Abbiamo tutte le risposte alle tue domande per aiutarti nella giusta scelta.

Chatta con noi

Chatta direttamente con il nostro supporto prevendita.

0256569681

Contattaci telefonicamente negli orari d’ufficio 9:30 – 19:30

Contattaci online

Apri una richiesta direttamente nell’area dei contatti.

INFORMAZIONI

Managed Server S.r.l. è un player italiano di riferimento nel fornire soluzioni avanzate di sistemistica GNU/Linux orientate all’alta performance. Con un modello di sottoscrizione dai costi contenuti e prevedibili, ci assicuriamo che i nostri clienti abbiano accesso a tecnologie avanzate nel campo dell’hosting, server dedicati e servizi cloud. Oltre a questo, offriamo consulenza sistemistica su sistemi Linux e manutenzione specializzata in DBMS, IT Security, Cloud e molto altro. Ci distinguiamo per l’expertise in hosting di primari CMS Open Source come WordPress, WooCommerce, Drupal, Prestashop, Joomla, OpenCart e Magento, affiancato da un servizio di supporto e consulenza di alto livello adatto per la Pubblica Amministrazione, PMI, ed aziende di qualsiasi dimensione.

Red Hat, Inc. detiene i diritti su Red Hat®, RHEL®, RedHat Linux®, e CentOS®; AlmaLinux™ è un marchio di AlmaLinux OS Foundation; Rocky Linux® è un marchio registrato di Rocky Linux Foundation; SUSE® è un marchio registrato di SUSE LLC; Canonical Ltd. detiene i diritti su Ubuntu®; Software in the Public Interest, Inc. detiene i diritti su Debian®; Linus Torvalds detiene i diritti su Linux®; FreeBSD® è un marchio registrato di The FreeBSD Foundation; NetBSD® è un marchio registrato di The NetBSD Foundation; OpenBSD® è un marchio registrato di Theo de Raadt. Oracle Corporation detiene i diritti su Oracle®, MySQL®, e MyRocks®; Percona® è un marchio registrato di Percona LLC; MariaDB® è un marchio registrato di MariaDB Corporation Ab; REDIS® è un marchio registrato di Redis Labs Ltd. F5 Networks, Inc. detiene i diritti su NGINX® e NGINX Plus®; Varnish® è un marchio registrato di Varnish Software AB. Adobe Inc. detiene i diritti su Magento®; PrestaShop® è un marchio registrato di PrestaShop SA; OpenCart® è un marchio registrato di OpenCart Limited. Automattic Inc. detiene i diritti su WordPress®, WooCommerce®, e JetPack®; Open Source Matters, Inc. detiene i diritti su Joomla®; Dries Buytaert detiene i diritti su Drupal®. Amazon Web Services, Inc. detiene i diritti su AWS®; Google LLC detiene i diritti su Google Cloud™ e Chrome™; Microsoft Corporation detiene i diritti su Microsoft®, Azure®, e Internet Explorer®; Mozilla Foundation detiene i diritti su Firefox®. Apache® è un marchio registrato di The Apache Software Foundation; PHP® è un marchio registrato del PHP Group. CloudFlare® è un marchio registrato di Cloudflare, Inc.; NETSCOUT® è un marchio registrato di NETSCOUT Systems Inc.; ElasticSearch®, LogStash®, e Kibana® sono marchi registrati di Elastic N.V. Hetzner Online GmbH detiene i diritti su Hetzner®; OVHcloud è un marchio registrato di OVH Groupe SAS; cPanel®, L.L.C. detiene i diritti su cPanel®; Plesk® è un marchio registrato di Plesk International GmbH; Facebook, Inc. detiene i diritti su Facebook®. Questo sito non è affiliato, sponsorizzato o altrimenti associato a nessuna delle entità sopra menzionate e non rappresenta nessuna di queste entità in alcun modo. Tutti i diritti sui marchi e sui nomi di prodotto menzionati sono di proprietà dei rispettivi detentori di copyright. Ogni altro marchio citato appartiene ai propri registranti. MANAGED SERVER® è un marchio registrato a livello europeo da MANAGED SERVER SRL, Via Enzo Ferrari, 9, 62012 Civitanova Marche (MC), Italia.

Torna in alto