{"id":4433,"date":"2023-12-05T23:00:14","date_gmt":"2023-12-05T23:00:14","guid":{"rendered":"https:\/\/www.consultingpb.com\/?p=4433"},"modified":"2023-12-05T23:00:16","modified_gmt":"2023-12-05T23:00:16","slug":"web-scraping-il-richiamano-al-rispetto-della-normativa-privacy","status":"publish","type":"post","link":"https:\/\/www.consultingpb.com\/en\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/","title":{"rendered":"Web scraping: il  richiamano al rispetto della normativa privacy"},"content":{"rendered":"\n<h3 class=\"wp-block-heading\" id=\"h-che-cosa-e\">Che cosa \u00e8?<\/h3>\n\n\n\n<p>Il <strong>web scraping<\/strong> \u00e8 una tecnica utilizzata per estrarre automaticamente dati da siti web. <\/p>\n\n\n\n<p>Consiste nell&#8217;utilizzo di software per navigare nei siti web, individuare i dati desiderati e salvarli in un formato strutturato come un file CSV o un database. <\/p>\n\n\n\n<p> \u00c8 un processo automatizzato che consente di raccogliere informazioni da diverse pagine web e salvarle in un formato strutturato, come un file CSV o un database.<\/p>\n\n\n\n<p>Il <strong>web scraping<\/strong> \u00e8 una tecnica utilizzata per estrarre dati dai siti web. Questo processo avviene attraverso l&#8217;uso di software che accede al web per recuperare informazioni specifiche da pagine web diverse. <\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-come-funziona\">Come funziona?<\/h3>\n\n\n\n<p>Ecco come funziona il processo di <strong>web scraping,<\/strong> passo dopo passo:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li><strong>Identificazione delle Pagine Web<\/strong>: Prima di iniziare, \u00e8 necessario identificare quali pagine web contengono le informazioni di interesse.\u00f9<\/li>\n\n\n\n<li><strong>Richieste HTTP<\/strong>: Il software di <strong>web scraping <\/strong>invia una richiesta HTTP alla pagina web desiderata, proprio come farebbe un browser quando si cerca di accedere a una pagina web.<\/li>\n\n\n\n<li><strong>Download del Contenuto<\/strong>: Una volta che la richiesta \u00e8 stata accettata dal server web, il codice HTML della pagina viene scaricato dallo scraper.<\/li>\n\n\n\n<li><strong>Parsing<\/strong>: Il passo successivo \u00e8 il parsing, ovvero l&#8217;analisi del codice HTML scaricato. Durante questa fase, lo scraper cerca i dati specifici che sono stati richiesti per l&#8217;estrazione.<\/li>\n\n\n\n<li><strong>Estrazione dei Dati<\/strong>: Quando i dati di interesse sono stati identificati, lo scraper li estrae dal codice HTML. Questo pu\u00f2 essere fatto utilizzando vari metodi, come espressioni regolari, parser HTML o framework specifici per il <strong>web scraping.<\/strong><\/li>\n\n\n\n<li><strong>Trasformazione dei Dati<\/strong>: I dati estratti spesso necessitano di una pulizia o di una trasformazione per essere utilizzabili. Questo pu\u00f2 includere la rimozione del codice HTML in eccesso, la conversione dei formati di data e ora o la traduzione dei dati in una struttura differente.<\/li>\n\n\n\n<li><strong>Salvataggio dei Dati<\/strong>: Infine, i dati puliti vengono salvati in un formato strutturato, come un file CSV, un database o un foglio di calcolo, per un&#8217;ulteriore analisi o per essere utilizzati in altre applicazioni.<\/li>\n<\/ol>\n\n\n\n<h3 class=\"wp-block-heading\">che cosa \u00e8 un crawler ?<\/h3>\n\n\n\n<p><em>chiamato anche bot o spider  \u00e8 un software che ha lo scopo di raccogliere tutte le informazioni necessarie per indicizzare in modo automatico le pagine di un sito, analizzare i collegamenti ipertestuali e trovare associazioni tra termini di ricerca e classificarli. <\/em><\/p>\n\n\n\n<p>\u00c8 largamente usato da tutti i\u00a0<strong>motori di ricerca<\/strong>, a cominciare da Google, per offrire agli utenti risultati sempre aggiorn<\/p>\n\n\n\n<p>Il  metodo, pi\u00f9 diffuso, \u00e8 il <strong>web scraping <\/strong>automatico, che viene effettuato utilizzando software  o algoritmi che scansionano e analizzano pi\u00f9 pagine web in modo automatico.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Gli utilizzi leciti<\/h3>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"h-il-web-scraping-nell-era-dell-economia-dei-dati-opportunita-e-linee-guida-legali\"><strong>Il Web Scraping nell&#8217;Era dell&#8217;Economia dei Dati: Opportunit\u00e0 e Linee Guida Legali<\/strong><\/h4>\n\n\n\n<p>Nel dinamico panorama digitale di oggi, il <strong>web scraping <\/strong>si \u00e8 affermato come uno strumento cruciale per le aziende e i professionisti del marketing. <\/p>\n\n\n\n<p>Questa pratica, che consiste nell&#8217;estrazione automatizzata di dati da siti web, \u00e8 diventata un pilastro nell&#8217;era dell&#8217;economia dei dati, giocando un ruolo chiave nel disegnare il paesaggio competitivo e nel guidare le decisioni strategiche.<\/p>\n\n\n\n<p>Il crawling, un processo che permette di navigare sistematicamente il web per identificare e catalogare informazioni, si rivela essenziale nell&#8217;analisi delle tendenze di mercato. <\/p>\n\n\n\n<p>Attraverso l&#8217;indagine statistica sull&#8217;utilizzo di prodotti e servizi, le aziende possono rilevare in tempo reale le preferenze dei consumatori e le direzioni emergenti del mercato.<\/p>\n\n\n\n<p> Con esso, le aziende hanno la possibilit\u00e0 di monitorare le strategie dei concorrenti, analizzando aspetti come i prezzi, le offerte speciali e la variet\u00e0 di prodotti. <\/p>\n\n\n\n<p>Questo tipo di monitoraggio \u00e8 cruciale in un contesto dove la rapidit\u00e0 nell&#8217;adattamento alle strategie altrui pu\u00f2 fare la differenza tra il successo e l&#8217;obsolescenza.<\/p>\n\n\n\n<p>Nonostante i benefici evidenti, la legalit\u00e0 dello scraping web \u00e8 spesso oggetto di discussione. <\/p>\n\n\n\n<p>Le aziende devono inoltre assicurarsi di non violare i Termini di Servizio dei siti da cui raccolgono dati. Questi documenti possono imporre restrizioni specifiche sullo scraping, che devono essere rispettate per evitare azioni legali.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-la-luce-verde-del-tribunale-di-roma-nel-caso-trenit\"> La Luce Verde del Tribunale di Roma nel Caso Trenit<\/h3>\n\n\n\n<p>Nel complesso panorama legale che regola il <strong>web scraping,<\/strong> una recente ordinanza del Tribunale di Roma ha segnato un punto di svolta, gettando luce sulla legittimit\u00e0 di questa pratica sotto determinate condizioni. Il caso in questione riguarda Trenit, un&#8217;applicazione sviluppata dalla societ\u00e0 inglese GoBright Media Ltd, che offre agli utenti la possibilit\u00e0 di consultare tariffe e informazioni sui treni ad alta velocit\u00e0.<\/p>\n\n\n\n<p>Trenitalia aveva avviato un&#8217;azione legale contro Trenit, accusando l&#8217;app di aver effettuato scraping improprio della propria banca dati, accedendo a informazioni sensibili come la gestione del traffico ferroviario, i prezzi dei biglietti, gli orari e i ritardi dei treni. <\/p>\n\n\n\n<p>La contesa legale ha sollevato questioni fondamentali sull&#8217;uso delle banche dati e sui diritti connessi al loro utilizzo.<\/p>\n\n\n\n<p>Tuttavia, i giudici romani hanno preso una posizione chiarificatrice, stabilendo che l&#8217;attivit\u00e0 di <strong>web scraping<\/strong> condotta da Trenit era legale. <\/p>\n\n\n\n<p>La decisione si basava su due considerazioni cruciali: <\/p>\n\n\n\n<p>primo, lo scraping interessava solo segmenti non sostanziali della banca dati di Trenitalia; <\/p>\n\n\n\n<p>secondo, le informazioni venivano acquisite singolarmente in base alle richieste degli utenti, senza che ci fosse un prelievo massivo o l&#8217;uso dell&#8217;intera banca dati.<\/p>\n\n\n\n<p> Il verdetto del Tribunale di Roma non solo ha riconosciuto la legittimit\u00e0 dello scraping in certi contesti ma ha anche fornito un quadro giuridico pi\u00f9 chiaro per coloro che desiderano utilizzare questa tecnica nel rispetto delle normative vigenti. <\/p>\n\n\n\n<p>Con questa decisione, il dibattito sullo scraping si arricchisce di un precedente importante che potrebbe influenzare futuri casi e legislazioni in Italia e oltre.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Utilizzi illeciti dello scraping<\/h3>\n\n\n\n<p>La legalit\u00e0 dello scraping web pende su un bilancio delicato. <\/p>\n\n\n\n<p>Diventa illegale quando si entra nel territorio del diritto d&#8217;autore e della privacy. <\/p>\n\n\n\n<p>L&#8217;uso improprio dei dati estratti pu\u00f2 portare a conseguenze legali gravi, specialmente se questi dati vengono utilizzati per scopi commerciali senza il consenso degli utenti o in violazione delle regole sulla concorrenza.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-web-scraping-e-privacy-il-caso-del-garante-privacy-contro-l-uso-indebito-di-dati-personali\">Web Scraping e Privacy: Il Caso del Garante Privacy contro l&#8217;Uso Indebito di Dati Personali<\/h3>\n\n\n\n<p> Recentemente, un caso emblematico ha riacceso il dibattito sulla privacy e sull&#8217;uso etico dei dati: il Garante privacy italiano ha posto un freno a una societ\u00e0 che aveva raccolto indebitamente i dati personali di dodici milioni di utenti.<\/p>\n\n\n\n<p>La societ\u00e0 in questione aveva utilizzato tecniche di scraping per estrarre nomi, cognomi, indirizzi e-mail e numeri di telefono da varie pagine web, creando poi un proprio sito che fungeva da elenco telefonico online. <\/p>\n\n\n\n<p>Questo database \u00e8 stato reso disponibile a terzi per attivit\u00e0 di telemarketing, senza il consenso degli utenti coinvolti, violando cos\u00ec le normative sulla protezione dei dati personali.<\/p>\n\n\n\n<p>L&#8217;intervento del Garante privacy ha evidenziato la linea sottile tra l&#8217;uso legittimo dello scraping per scopi di analisi e ricerca di mercato e l&#8217;uso illegittimo che incide sulla privacy individuale. <\/p>\n\n\n\n<p>La decisione del Garante privacy serve da monito per tutte le aziende che si avvalgono dello scraping: \u00e8 imperativo operare nel pieno rispetto delle leggi sulla protezione dei dati. <\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-il-divieto-di-uso-indebito-di-e-mail-commerciali\">Il Divieto di Uso Indebito di E-mail Commerciali<\/h3>\n\n\n\n<p> In un&#8217;azione che ribadisce la sua posizione ferma contro l&#8217;uso improprio di dati personali, il Garante ha vietato a una societ\u00e0 l&#8217;invio di e-mail commerciali a liberi professionisti.<\/p>\n\n\n\n<p>La vicenda ha preso le mosse quando la societ\u00e0 in questione ha raccolto indirizzi di posta elettronica e PEC (Posta Elettronica Certificata) da elenchi di pubblico dominio.<\/p>\n\n\n\n<p> Bench\u00e9 questi elenchi fossero liberamente accessibili, la societ\u00e0 ha omesso un passaggio fondamentale: ottenere il consenso esplicito dei legittimi proprietari dei dati prima di utilizzarli per fini commerciali.<\/p>\n\n\n\n<p>Questo caso sottolinea un principio cardine nella gestione della privacy: l&#8217;accessibilit\u00e0 dei dati non equivale a un liberi tutti per il loro utilizzo. <\/p>\n\n\n\n<p>Il Garante ha chiarito che, anche se i dati sono disponibili in spazi pubblici, ci\u00f2 non concede automaticamente alle aziende il diritto di usarli per comunicazioni commerciali.<\/p>\n\n\n\n<p>L&#8217;episodio serve da monito per le aziende che si avvalgono di tattiche di marketing digitale, ricordando loro che le strategie di raccolta dati devono essere sempre allineate con le normative vigenti in materia di privacy e protezione dei dati. In particolare, il Regolamento Generale sulla Protezione dei Dati (GDPR) dell&#8217;Unione Europea e la legislazione italiana impongono requisiti stringenti per il consenso e la trasparenza nell&#8217;uso dei dati personali.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Navigare le Acque del Web Scraping: Legalit\u00e0, Etica e Sicurezza Digitale<\/h3>\n\n\n\n<p>La legalit\u00e0 del suo utilizzo rimane un argomento nebuloso e densamente popolato di sfumature giuridiche. <\/p>\n\n\n\n<p>Chi si imbarca nell&#8217;uso di tecnologie per estrarre dati da siti internet deve navigare con cautela nel rispetto dei diritti d&#8217;autore e delle misure anti-scraping adottate dai gestori dei siti web.<\/p>\n\n\n\n<p>La pratica del <strong>web scraping <\/strong>si scontra spesso con le barriere erette dai proprietari dei dati: aree riservate accessibili solo tramite registrazione, l&#8217;impiego di servizi anti-bot, file robots.txt che indicano quali parti di un sito possono essere esplorate dai crawler, e il blocco degli indirizzi IP sospetti. <\/p>\n\n\n\n<p>Questi strumenti rappresentano una difesa legittima contro l&#8217;accesso non autorizzato e l&#8217;utilizzo improprio di database.<\/p>\n\n\n\n<p>La chiarezza dei Termini di Servizio (TOS) di un sito \u00e8 essenziale; questi devono esplicitare il divieto di utilizzo di tecniche di scraping per il recupero sistematico di dati. <\/p>\n\n\n\n<p>In caso di violazione, i TOS diventano lo strumento attraverso il quale i proprietari dei dati possono agire in giudizio, richiedendo provvedimenti inibitori e il risarcimento dei danni subiti.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Il Web Scraping e la Sfida della Privacy nell&#8217;Era dell&#8217;Intelligenza Artificiale<\/h3>\n\n\n\n<p>In un mondo sempre pi\u00f9 guidato dai dati, l&#8217;ascesa dell&#8217;intelligenza artificiale generativa ha sollevato questioni etiche e legali di grande rilievo. <\/p>\n\n\n\n<p>Piattaforme come quelle di OpenAI, con prodotti di punta come ChatGPT e DALL-E, stanno al centro di un dibattito acceso riguardo le metodologie di training dell&#8217;AI, in particolare l&#8217;uso del <strong>web scraping<\/strong> per acquisire dataset vasti e diversificati dai siti web, inclusi i social media.<\/p>\n\n\n\n<p>Il <strong>web scraping <\/strong>\u00e8 diventato uno strumento comune per la creazione di questi dataset. <\/p>\n\n\n\n<p>Tuttavia, mentre la tecnologia avanza, emergono preoccupazioni significative riguardo la privacy degli utenti e l&#8217;uso dei loro dati personali.<\/p>\n\n\n\n<p>Recentemente, \u00e8 venuto alla luce che alcune delle pi\u00f9 grandi piattaforme di IA generativa potrebbero aver utilizzato dati ottenuti mediante scraping per addestrare i loro sistemi. <\/p>\n\n\n\n<p>Questo solleva interrogativi su come i dati vengano raccolti, utilizzati e proteggi autorit\u00e0 internazionali di privacy hanno espresso preoccupazione per questa pratica, evidenziando il bisogno di una regolamentazione pi\u00f9 stringente che tuteli i dati personali degli utenti.<\/p>\n\n\n\n<p>Questi dati, che possono includere informazioni personali pubblicate per scopi ben definiti come la cronaca o la trasparenza amministrativa, diventano il carburante per gli algoritmi che apprendono e si evolvono.<\/p>\n\n\n\n<p>Un consesso internazionale di autorit\u00e0 di controllo della privacy sta ora sollecitando i gestori di siti web, in particolare i grandi social media, a conformarsi alle leggi sulla privacy. <\/p>\n\n\n\n<p>L&#8217;allerta \u00e8 rivolta sia ai titolari dei dati sia agli utenti, avvertendoli dei potenziali rischi di violazioni derivanti da questa pratica.<\/p>\n\n\n\n<p>La tensione tra l&#8217;innovazione tecnologica e il diritto alla privacy personale non \u00e8 nuova, ma l&#8217;escalation del <strong>web scraping<\/strong> ha portato la questione sotto i riflettori con una nuova urgenza. Mentre le piattaforme di IA continuano a prosperare, il bisogno di un equilibrio tra progresso e protezione dei dati personali diventa sempre pi\u00f9 critico.<\/p>\n\n\n\n<p>Mentre il <strong>web scraping<\/strong> rimane una pratica controversa, il suo impatto sull&#8217;addestramento dell&#8217;IA e sulla privacy individuale continuer\u00e0 a essere un punto focale nel dibattito globale sulla regolamentazione del cyberspazio. <\/p>\n\n\n\n<p>La sfida per i legislatori sar\u00e0 quella di trovare un punto d&#8217;incontro che tuteli sia l&#8217;innovazione che la privacy degli individui in un mondo sempre pi\u00f9 guidato dai dati.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-il-garante-privacy-solleva-il-velo-sul-web-scraping-indagine-e-implicazioni-per-l-ai\">Il Garante Privacy Solleva il Velo sul Web Scraping: Indagine e Implicazioni per l&#8217;AI<\/h3>\n\n\n\n<p>Il 24 Novembre 2023, il Garante della Privacy ha avviato un&#8217;indagine per esaminare la raccolta di dati personali online utilizzata per addestrare algoritmi di intelligenza artificiale. L&#8217;indagine, che coinvolge siti web pubblici e privati, mira a valutare l&#8217;adozione di misure di sicurezza appropriate per prevenire la raccolta massiva di dati personali da parte di terzi (webscraping). Questa mossa segna un punto di svolta significativo nella storia della privacy digitale in Italia.<\/p>\n\n\n\n<p>Il focus dell&#8217;indagine \u00e8 la verifica delle misure di sicurezza adottate da entit\u00e0 pubbliche e private per prevenire la raccolta massiva non autorizzata di dati personali. <\/p>\n\n\n\n<p>Diverse piattaforme di intelligenza artificiale impiegano il webscraping per raccogliere vasti volumi di dati, compresi quelli personali, da siti di enti pubblici e privati per vari scopi, come la cronaca e la trasparenza amministrativa.<\/p>\n\n\n\n<p>A titolo di esempio, possiamo citare le piattaforme legate alla cronaca<\/p>\n\n\n\n<p>Il webscraping \u00e8 una tecnica usata per estrarre grandi volumi di dati da internet, inclusi dati personali, per finalit\u00e0 diverse come l&#8217;informazione o la trasparenza amministrativa. Piattaforme di IA si servono di questa pratica per acquisire molte informazioni, anche personali, pubblicate online con scopi specifici.<\/p>\n\n\n\n<p>Il Garante per la protezione dei dati personali invita associazioni, consumatori, esperti e accademici a inviare suggerimenti sulle misure di sicurezza contro il webscraping. I contributi vanno inviati via email entro 60 giorni dalla pubblicazione dell&#8217;invito sul sito dell&#8217;Autorit\u00e0. all\u2019indirizzo\u00a0<strong>webscraping@gpdp.it<\/strong>.<\/p>\n\n\n\n<p>L&#8217;indagine non \u00e8 solo un&#8217;analisi: \u00e8 un monito. <\/p>\n\n\n\n<p>Il Garante per la privacy potrebbe intraprendere azioni, incluse quelle urgenti, in base ai risultati dell&#8217;indagine sulla raccolta di dati personali.<\/p>\n\n\n\n<p>Questo annuncio \u00e8 un chiaro segnale che il periodo di &#8220;far west&#8221; digitale potrebbe avvicinarsi alla sua conclusione, con l&#8217;introduzione di regole pi\u00f9 stringenti e controlli pi\u00f9 severi.<\/p>\n\n\n\n<p>In un mondo sempre pi\u00f9 guidato dai dati, la questione sollevata dal Garante per la Privacy non potrebbe essere pi\u00f9 tempestiva. <\/p>\n\n\n\n<p>Con l&#8217;IA che permea ogni aspetto della vita quotidiana, dalla selezione dei contenuti che vediamo sui social media alle decisioni finanziarie, la raccolta responsabile e etica dei dati non \u00e8 solo una questione legale, ma anche morale.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-il-perche-di-questa-iniziativa-le-parole-dell-avv-guido-scorza-membro-del-garante-della-protezione-dei-dati-personali\">Il perch\u00e8  di questa iniziativa. Le parole dell&#8217;avv. Guido Scorza &#8211; membro del Garante della Protezione dei dati personali <\/h3>\n\n\n\n<p><em>I <strong>dati\u00a0<\/strong>personali di miliardi di persone, frammenti della loro identit\u00e0 personale e \u201ctitoli rappresentativi\u201d di un diritto fondamentale come il diritto alla privacy vengono letteralmente\u00a0<strong>pescati a strascico dalle grandi fabbriche dell\u2019<a href=\"https:\/\/www.agendadigitale.eu\/tag\/intelligenza-artificiale\/\">intelligenza artificiale<\/a>\u00a0<\/strong>globale per l\u2019addestramento dei propri algoritmi e, dunque, trasformati in assets commerciali e tecnologici di pochi al fine consentire a questi ultimi di fare business.<\/em><\/p>\n\n\n\n<p><em>Il tutto avviene come se il web fosse un\u2019immensa prateria nella quale tutto \u00e8 di tutti e chiunque pu\u00f2 pertanto impossessarsene e farlo proprio per qualsiasi finalit\u00e0.<\/em><\/p>\n\n\n\n<p><em><strong>I dati personali che i crawler delle big tech dell\u2019intelligenza artificiale raccolgono online, infatti, sono pubblicati da una pluralit\u00e0 di soggetti \u2013 i gestori dei siti internet \u2013 per una serie di finalit\u00e0 necessariamente predeterminate e diverse dall\u2019addestramento degli algoritmi:<\/strong>\u00a0il diritto di cronaca nel caso degli editori, la trasparenza nel caso delle pubbliche amministrazioni, un contratto con gli interessati nel caso di siti destinati alla pubblicazione di ogni tipo di annunci da quelli commerciali a quelli personali e sentimentali ecc.<\/em><\/p>\n\n\n\n<p><em><strong>Ed \u00e8 proprio qui che nasce il dubbio che con un\u2019indagine conoscitiva appena avviata,\u00a0<\/strong>come Garante per la protezione dei dati personali, vorremmo approfondire e attorno al quale vorremmo avviare una riflessione ampia e condivisa: i gestori dei singoli siti internet che costituiscono i \u201cpascoli\u201d attraverso i quali gli algoritmi delle major dell\u2019intelligenza artificiale sono sfamati dovrebbero o non dovrebbero proteggere i propri confini con idonee misure di sicurezza capaci di impedire a terzi di appropriarsi di ci\u00f2 che loro pubblicano per una finalit\u00e0 determinata?<\/em><\/p>\n\n\n\n<p><strong><em>E in caso di risposta affermativa quale potrebbe essere una soglia ragionevole per un simile obbligo?<\/em><\/strong><\/p>\n\n\n\n<p><em>Potrebbe, ad esempio, trattarsi dell\u2019adozione, almeno, degli strumenti che, proprio a tal fine \u2013 anche se, in realt\u00e0, sulla base di preoccupazioni relative prevalentemente al diritto d\u2019autore e alla concorrenza sleale \u2013 le grandi fabbriche degli algoritmi o, almeno, alcune di esse gi\u00e0 rendono disponibili e che, alcuni editori \u2013 si veda ad esempio il caso del New York Times \u2013 hanno gi\u00e0 annunciato di aver implementato?<\/em><\/p>\n\n\n\n<p><strong><em>Ovviamente non \u00e8 l\u2019unica risposta possibile.<\/em><\/strong><\/p>\n\n\n\n<p><em>Guai a dirsi certi di questa o quella soluzione perch\u00e9 la materia \u00e8 complessa ma la questione sembra meritare pi\u00f9 attenzione di quanta, sin qui, in giro per il mondo, sembra averne ricevuta.<\/em><\/p>\n\n\n\n<h3 class=\"wp-block-heading\">La Protezione dei Dati nell&#8217;Era del Data Scraping: Una Battaglia Legale in Ascesa<\/h3>\n\n\n\n<p>L&#8217;Associazione Italiana Internet Provider (AIIP) ha recentemente espresso preoccupazione riguardo all&#8217;indagine condotta dal Garante per la Protezione dei Dati Personali, temendo un focus improprio che potrebbe penalizzare le imprese italiane che subiscono scraping piuttosto che perseguire i veri artefici di queste pratiche.<\/p>\n\n\n\n<p>Da anni, grandi motori di ricerca e big tech hanno praticato il data scraping su larga scala. Questa attivit\u00e0, che coinvolge la raccolta di dati personali degli utenti da vari siti web, solleva questioni legali e etiche significative. Il Garante per la Protezione dei Dati Personali ha il compito di vigilare su queste pratiche e garantire che i dati personali degli utenti siano protetti secondo le normative vigenti, come il GDPR.<\/p>\n\n\n\n<p>Il caso di Clearview AI \u00e8 emblematico: l&#8217;azienda \u00e8 stata sanzionata in Italia e ha affrontato azioni legali in altre nazioni per aver raccolto dati biometrici senza consenso. <\/p>\n\n\n\n<p>Queste azioni internazionali riflettono l&#8217;importanza di una regolamentazione efficace e di un campo di gioco equo per tutte le imprese.<\/p>\n\n\n\n<p>L&#8217;AIIP sottolinea l&#8217;importanza di riconoscere le aziende vittime di scraping come tali, piuttosto che soggetti di indagine. <\/p>\n\n\n\n<p>Inoltre, evidenzia la necessit\u00e0 di un approccio mirato nei confronti delle big tech per evitare una concorrenza sleale che danneggerebbe il tessuto imprenditoriale italiano e l&#8217;intero ecosistema digitale del paese.<\/p>\n\n\n\n<p>In questo contesto, il Garante per la Protezione dei Dati Personali \u00e8 chiamato a un ruolo chiave per garantire una protezione adeguata dei dati personali e garantire che le pratiche di <strong>web scraping <\/strong>non violino i diritti degli individui n\u00e9 creino disparit\u00e0 nel mercato digitale.<\/p>\n\n\n\n<p>La questione dello scraping \u00e8 complessa e richiede un&#8217;attenzione maggiore a livello globale. Mentre il Garante italiano si muove per approfondire l&#8217;indagine, \u00e8 fondamentale considerare l&#8217;impatto di queste pratiche sul diritto alla privacy e sulla concorrenza leale tra le aziende operanti nel digitale.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">I problemi aperti e le possibili violazioni al GDPR<\/h3>\n\n\n\n<p>La propriet\u00e0 intellettuale \u00e8 uno dei pilastri messi in discussione dall&#8217;attivit\u00e0 di scraping. I contenuti online, da testi a immagini, sono spesso protetti da diritti d&#8217;autore e l&#8217;estrazione non autorizzata potrebbe configurarsi come una violazione di tali diritti. <\/p>\n\n\n\n<p>Questo aspetto \u00e8 particolarmente delicato quando gli scraper analizzano e utilizzano i contenuti in modi che potrebbero non essere consentiti senza il permesso degli aventi diritto.<\/p>\n\n\n\n<p>Inoltre, il <strong>web scraping <\/strong>pu\u00f2 entrare in conflitto con i termini di servizio stabiliti dai siti web. Molte piattaforme online includono clausole che vietano esplicitamente l&#8217;estrazione automatizzata dei dati, rendendo gli scraper soggetti a potenziali azioni legali per violazione contrattuale.<\/p>\n\n\n\n<p>La questione si complica quando si considerano le normative sulla protezione dei dati personali, come il Regolamento Generale sulla Protezione dei Dati (GDPR) dell&#8217;Unione Europea. Secondo l&#8217;articolo 4, paragrafo 1 del GDPR, i dati personali richiedono un trattamento particolarmente attento. <\/p>\n\n\n\n<p>Laddove i dati estratti siano classificabili come personali, le implicazioni legali si moltiplicano. Il GDPR richiede che per la raccolta e l&#8217;analisi di tali dati sia ottenuto il consenso esplicito dell&#8217;interessato, rendendo la pratica dello scraping senza tale consenso potenzialmente illegale.<\/p>\n\n\n\n<p>Ancora pi\u00f9 stringenti sono le restrizioni sui cosiddetti &#8220;dati particolari&#8221;, per i quali non pu\u00f2 essere invocato il legittimo interesse come base giuridica per il loro trattamento. <\/p>\n\n\n\n<p>In assenza di un rapporto preesistente con l&#8217;individuo cui i dati si riferiscono, \u00e8 difficile immaginare una situazione in cui lo scraping possa essere considerato legalmente legittimo.<\/p>\n\n\n\n<p>La mancanza di trasparenza \u00e8 uno degli altri aspetti pi\u00f9 critici. <\/p>\n\n\n\n<p>Gli utenti spesso non sono a conoscenza che i loro dati vengono estratti e analizzati, violando cos\u00ec gli articoli 13 e 14 del GDPR che prescrivono l&#8217;obbligo di informare gli interessati sull&#8217;uso che viene fatto delle loro informazioni personali. <\/p>\n\n\n\n<p>Questo deficit informativo si traduce in una violazione del diritto alla privacy degli utenti, che rimangono all&#8217;oscuro delle finalit\u00e0 per cui i loro dati vengono raccolti.<\/p>\n\n\n\n<p>Un altro punto critico \u00e8 rappresentato dalla finalit\u00e0 della raccolta dati. <\/p>\n\n\n\n<p>Spesso i dati estratti tramite <strong>web scraping <\/strong>sono utilizzati per scopi diversi da quelli per cui sono stati originariamente condivisi dagli utenti, creando una discrepanza tra l&#8217;intenzione dell&#8217;utente e l&#8217;uso effettivo dei suoi dati personali.<\/p>\n\n\n\n<p>Inoltre, il GDPR pone limiti stringenti sulla conservazione dei dati, esigendo che questi siano mantenuti non oltre il tempo necessario per i fini per cui sono stati raccolti. <\/p>\n\n\n\n<p>Tuttavia, con il <strong>web scraping<\/strong>, la durata della conservazione dei dati spesso rimane incerta o indeterminata, e in molti casi eccede il tempo strettamente necessario, entrando in conflitto con i principi di limitazione della conservazione previsti dal GDPR.<\/p>\n\n\n\n<p>La condivisione non autorizzata dei dati verso terzi \u00e8 un altro terreno minato. Il trasferimento di informazioni personali a parti non autorizzate senza il consenso esplicito dell&#8217;interessato costituisce una violazione diretta del GDPR.<\/p>\n\n\n\n<p>Infine, il <strong>web scraping <\/strong>pu\u00f2 ostacolare l&#8217;esercizio dei diritti degli interessati, come stabilito dagli articoli 15-22 del GDPR. <\/p>\n\n\n\n<p>Questi diritti includono la possibilit\u00e0 per gli utenti di accedere ai propri dati, di richiederne la rettifica o la cancellazione, e di opporsi al loro trattamento. <\/p>\n\n\n\n<p>La pratica dello scraping, spesso automatizzata e opaca, rende difficile per gli utenti esercitare tali diritti.<\/p>\n\n\n\n<p>Il <strong>web scraping,<\/strong> che permette di raccogliere automaticamente grandi volumi di dati dai siti web, pu\u00f2 infatti esporre a rischi non solo gli utenti dei siti ma anche i titolari dei siti stessi. Secondo l&#8217;articolo 33 del GDPR, i titolari dei siti web sono tenuti a valutare gli incidenti di sicurezza e, qualora si verifichi una violazione dei dati, a notificarla alle autorit\u00e0 di controllo competenti. In casi di rischio elevato per i diritti e le libert\u00e0 delle persone fisiche, \u00e8 necessaria anche la comunicazione diretta agli interessati, come stabilito dall&#8217;articolo 34 del GDPR.<\/p>\n\n\n\n<p>Il dibattito si intensifica quando si considerano le recenti controversie relative al <strong>web scraping, <\/strong>come quella emersa attorno ai dati estratti dal sito di incontri OkCupid, utilizzati per ricerche senza il consenso degli utenti[1]. Q<\/p>\n\n\n\n<p>Questi episodi evidenziano la tensione tra il bisogno di dati per scopi analitici e la necessit\u00e0 di proteggere la privacy degli individui.<\/p>\n\n\n\n<p>Dal punto di vista tecnologico, il settore \u00e8 in rapida evoluzione. <\/p>\n\n\n\n<p>Strumenti come Scrapy continuano a dominare la scena per gli sviluppatori Python, mentre nuove librerie come Crawlee stanno emergendo per offrire soluzioni avanzate agli sviluppatori JavaScript[4]. Allo stesso tempo, strumenti dedicati al monitoraggio delle operazioni di scraping come ScrapeOps cercano di semplificare e ottimizzare le pratiche di scraping, pur rimanendo all&#8217;interno del quadro legale.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Digital Services Act: Il Nuovo Orizzonte Regolativo dello Scraping<\/h3>\n\n\n\n<p>Il panorama normativo europeo si sta adattando rapidamente all&#8217;evoluzione digitale, come dimostra l&#8217;introduzione del Digital Services Act (DSA) &#8211; Regolamento UE 2065\/2022. <\/p>\n\n\n\n<p>Questa nuova legislazione, con un occhio di riguardo verso la trasparenza e la responsabilit\u00e0 online, ha riconosciuto e affrontato specificamente l&#8217;uso di bot e crawler nello scraping dei dati.<\/p>\n\n\n\n<p>Al considerando 77 del DSA, si evidenzia una distinzione importante:<\/p>\n\n\n\n<p><em> i titolari di piattaforme online e motori di ricerca sono invitati a non includere bot e crawler nel conteggio degli utenti attivi. <\/em><\/p>\n\n\n\n<p>Questo perch\u00e9, non essendo utenti reali ma piuttosto strumenti automatizzati, la loro attivit\u00e0 non riflette il comportamento umano genuino.<\/p>\n\n\n\n<p>Questa menzione nel DSA sottolinea un punto cruciale: lo scraping non \u00e8 un fenomeno invisibile o marginale, ma una pratica rilevante che pu\u00f2 influenzare l&#8217;analisi dei dati e le metriche di successo di un sito. <\/p>\n\n\n\n<p>L&#8217;esclusione dei bot dal conteggio degli utenti attivi mira a fornire una rappresentazione pi\u00f9 accurata del traffico umano e dell&#8217;engagement sui siti web.<\/p>\n\n\n\n<p>Il DSA si inserisce in un contesto normativo pi\u00f9 ampio che include anche il GDPR, creando cos\u00ec un quadro legislativo coerente per affrontare le sfide poste dalla digitalizzazione. Mentre il GDPR regola la protezione dei dati personali e la privacy degli utenti, il DSA punta a garantire un ambiente digitale sicuro e trasparente, dove anche le pratiche di <strong>web scraping<\/strong> sono considerate e regolamentate.<\/p>\n\n\n\n<p>L&#8217;approccio dell&#8217;UE riflette una crescente consapevolezza dell&#8217;importanza di bilanciare l&#8217;innovazione tecnologica con la protezione dei consumatori. <\/p>\n\n\n\n<p>In conclusione, il Digital Services Act rappresenta un passo avanti significativo nel riconoscimento e nella regolamentazione delle pratiche di <strong>web scraping. <\/strong><\/p>\n\n\n\n<h3 class=\"wp-block-heading\">L&#8217;AI Act Europeo Pone Nuovi Limiti allo Scraping dei Dati Biometrici<\/h3>\n\n\n\n<p>Le ultime versioni del documento delineano una posizione ferma: sar\u00e0 espressamente vietato l&#8217;utilizzo di dati biometrici ottenuti tramite <strong>web scraping<\/strong> da social media o sistemi di videoripresa CCTV per finalit\u00e0 di riconoscimento facciale a scopo di sorveglianza di massa. <\/p>\n\n\n\n<p>Questa mossa rappresenta un passo significativo verso la tutela dei diritti fondamentali dei cittadini nell&#8217;era digitale, ponendo un freno alle pratiche invasive di sorveglianza che hanno sollevato ampie controversie in tutto il mondo.<\/p>\n\n\n\n<p>Il dibattito sull&#8217;etica dell&#8217;AI e sull&#8217;uso dei dati biometrici non \u00e8 nuovo. <\/p>\n\n\n\n<p>L&#8217;AI Act, quindi, non solo risponde a queste preoccupazioni ma stabilisce anche un precedente importante per la regolamentazione globale dell&#8217;intelligenza artificiale.<\/p>\n\n\n\n<p>In attesa della versione finale dell&#8217;AI Act, il settore tecnologico deve prepararsi a un aggiornamento delle proprie politiche e pratiche.<\/p>\n\n\n\n<p> L&#8217;adozione di tecniche di <strong>web scraping<\/strong> rispettose della privacy e la ricerca di soluzioni alternative per la raccolta dati diventeranno essenziali per operare nel rispetto delle nuove normative europee.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Autorit\u00e0 Internazionali di Privacy Uniscono le Forze contro lo Scraping sui Social Media<\/h3>\n\n\n\n<p>In una mossa senza precedenti, una coalizione di autorit\u00e0 di controllo della privacy a livello mondiale ha emesso una dichiarazione congiunta il 24 agosto 2023, segnalando un&#8217;azione coordinata per affrontare le sfide poste dal <strong>web scraping <\/strong>sui social media.<\/p>\n\n\n\n<p> La dichiarazione, che vede firmatari da varie parti del mondo, tra cui l&#8217;ICO del Regno Unito, l&#8217;Officer della privacy canadese e la Datatilsynet norvegese, mira a sensibilizzare riguardo ai rischi per la privacy derivanti dall&#8217;uso improprio dei dati personali estratti dai social media.<\/p>\n\n\n\n<p>Il documento  mette in evidenza la crescente preoccupazione per la sicurezza delle informazioni personali degli utenti di piattaforme come YouTube, TikTok, Instagram, Facebook, LinkedIn, Weibo e X (precedentemente noto come Twitter). <\/p>\n\n\n\n<p>Queste piattaforme, utilizzate quotidianamente da miliardi di persone, sono diventate terreno fertile per il<strong> web scraping,<\/strong> una pratica che pu\u00f2 portare all&#8217;utilizzo non autorizzato di dati biometrici e personali.<\/p>\n\n\n\n<p>La dichiarazione congiunta rappresenta un raro esempio di comunicazione internazionale unita su tale tema, evidenziando i problemi transfrontalieri che rendono complesse le azioni di rimedio. Le autorit\u00e0 hanno espresso l&#8217;intenzione di fornire &#8220;certezza e coerenza transfrontaliera&#8221; nella protezione dei dati pubblicati online e hanno esortato i titolari delle piattaforme a partecipare attivamente al dialogo fornendo feedback.<\/p>\n\n\n\n<p>Inoltre, il comunicato serve da avvertimento ai gestori dei social media: le autorit\u00e0 hanno pianificato controlli per assicurarsi che vengano rispettate le normative sulla privacy. L&#8217;obiettivo \u00e8 migliorare la compliance e limitare l&#8217;uso dello scraping, che spesso si traduce in violazioni della privacy segnalate dagli stessi utenti.<\/p>\n\n\n\n<p>Questo sforzo congiunto segna un punto di svolta nella governance della privacy online e potrebbe portare a un rafforzamento delle politiche e delle misure di sicurezza implementate dai social media. <\/p>\n\n\n\n<p>La fiducia degli utenti nell&#8217;ambiente digitale \u00e8 in gioco, e le azioni intraprese dalle autorit\u00e0 internazionali di privacy sono un passo significativo verso il ripristino di quella fiducia.<\/p>\n\n\n\n<p>Il messaggio \u00e8 chiaro: l&#8217;era del laissez-faire digitale sta finendo, e un nuovo capitolo di responsabilit\u00e0 e protezione dei dati personali sta per iniziare. <\/p>\n\n\n\n<p>Con la crescente attenzione su questi temi, \u00e8 probabile che vedremo ulteriori sviluppi e maggiore cooperazione internazionale nel futuro prossimo.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">I Rischi Crescenti dello Scraping dei Dati Social: Un Campanello d&#8217;Allarme dalle Autorit\u00e0 di Privacy<\/h3>\n\n\n\n<p> Queste includono attacchi informatici mirati, furto di identit\u00e0, monitoraggio e profilazione non autorizzata, scopi politici o di raccolta di intelligence, marketing diretto indesiderato e, in generale, una perdita di controllo sui propri dati personali.<\/p>\n\n\n\n<p>Le informazioni personali, una volta &#8220;raschiate&#8221; e pubblicate su forum di hacking, possono diventare un facile bersaglio per attacchi di social engineering o phishing. Inoltre, i dati estratti dai profili pubblici possono essere utilizzati per creare account falsi, alimentare database di riconoscimento facciale o inviare spam.<\/p>\n\n\n\n<p>Queste pratiche non solo violano la privacy degli utenti ma possono anche avere implicazioni legali per coloro che utilizzano questi dati per alimentare dataset o addestrare algoritmi di intelligenza artificiale. <\/p>\n\n\n\n<p>Le aziende che si avvalgono di software e database alimentati da dati raccolti illecitamente potrebbero trovarsi a fronteggiare serie conseguenze giuridiche.<\/p>\n\n\n\n<p>Nonostante la crescente preoccupazione e i tentativi di regolamentazione, lo scraping dei dati rimane una pratica diffusa. Il chiaro messaggio delle autorit\u00e0 \u00e8 che la trasparenza e il consenso dell&#8217;utente devono essere al centro di ogni raccolta di dati. La dichiarazione congiunta sottolinea la necessit\u00e0 di un cambiamento significativo nell&#8217;approccio al <strong>web scraping<\/strong> e nella gestione dei dati personali.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Il Caso Clearview AI e il Dibattito Globale sulla Privacy nel Web Scraping<\/h3>\n\n\n\n<p>Il fenomeno dello scraping dei dati biometrici ha raggiunto un punto di svolta con il caso di Clearview AI, un&#8217;azienda statunitense che \u00e8 diventata un punto di riferimento globale nel dibattito sulla privacy e l&#8217;uso etico dei dati. L&#8217;ordinanza-ingiunzione del 10 febbraio 2022 da parte del Garante per la protezione dei dati personali italiano ha messo in luce le pratiche di questa societ\u00e0, che ha raccolto dati biometrici da vari social media per creare un&#8217;enorme banca dati utilizzata per addestrare sistemi di riconoscimento facciale.<\/p>\n\n\n\n<p>Questo caso non \u00e8 isolato; Clearview AI ha affrontato azioni legali e amministrative in diverse parti del mondo, segnalando una crescente preoccupazione internazionale. Reclami sono stati presentati in Francia, Austria, Grecia e nel Regno Unito per violazioni del GDPR, mentre l&#8217;European Data Protection Supervisor (EDPS) ha esaminato l&#8217;utilizzo di Clearview AI da parte di Europol.<\/p>\n\n\n\n<p>L&#8217;uso dei dati raccolti tramite <strong>web scraping<\/strong> da Clearview AI solleva questioni di grande rilevanza etica e legale. I dati biometrici, che includono riconoscimenti facciali e altre caratteristiche personali identificabili, sono particolarmente sensibili e la loro raccolta e utilizzo senza il consenso degli utenti rappresenta una grave minaccia alla privacy.<\/p>\n\n\n\n<p>Il caso Clearview AI serve come campanello d&#8217;allarme per le autorit\u00e0 normative, le aziende e gli utenti dei social media. La necessit\u00e0 di un quadro normativo pi\u00f9 rigoroso e di pratiche etiche nell&#8217;uso dei dati \u00e8 evidente. La protezione della privacy degli individui deve essere prioritaria, con un&#8217;attenzione particolare ai dati sensibili come quelli biometrici.<\/p>\n\n\n\n<p>Negli Stati Uniti, l&#8217;American Civil Liberties Union (ACLU) ha intentato una causa contro Clearview AI nello Stato dell&#8217;Illinois nel 2020, accusando l&#8217;azienda di aver violato l&#8217;Illinois Biometric Privacy Act. Questo atto ha portato a un accordo vincolante che impone a Clearview di rispettare determinate condizioni, tra cui l&#8217;interruzione della vendita dei suoi prodotti a societ\u00e0 private statunitensi.<\/p>\n\n\n\n<p>In Canada, il Privacy Commissioner ha definito le attivit\u00e0 di &#8220;raschiamento&#8221; dei volti sui social media da parte di Clearview come illecite, descrivendo il sistema creato dall&#8217;azienda come uno che &#8220;infligge un danno diffuso a tutti i membri della societ\u00e0&#8221;. Le parole forti del commissario risuonano con l&#8217;immagine evocativa di cittadini inermi allineati in una fila di polizia virtuale, senza il loro consenso.<\/p>\n\n\n\n<p>Anche in Australia, l&#8217;Office of the Australian Information Commissioner (OAIC) ha preso una posizione ferma contro Clearview, stabilendo che l&#8217;azienda ha violato il Privacy Act 1988 dell&#8217;Australia. La raccolta di dati personali degli australiani senza consenso e l&#8217;uso di mezzi scorretti per ottenere tali informazioni sono stati giudicati non solo illegali ma anche eticamente discutibili.<\/p>\n\n\n\n<p>Queste azioni internazionali contro Clearview AI evidenziano una tendenza crescente verso la sensibilizzazione e la regolamentazione dell&#8217;uso dei dati personali. La questione centrale \u00e8 se le aziende dovrebbero essere autorizzate a raccogliere dati in massa da fonti pubbliche, come i social media, soprattutto quando questi dati includono informazioni biometriche sensibili.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-un-dibattito-aperto\">Un dibattito aperto<\/h3>\n\n\n\n<p>Mentre le aziende come Clearview AI sostengono che i loro servizi possono aiutare nella lotta contro il crimine e nel rafforzamento della sicurezza nazionale, gli attivisti della privacy e le autorit\u00e0 normative insistono sulla necessit\u00e0 di un consenso informato e sulla protezione dei dati personali come fondamenti imprescindibili della societ\u00e0 digitale.<\/p>\n\n\n\n<p>In conclusione, il caso Clearview AI non \u00e8 solo un campanello d&#8217;allarme per le implicazioni del <strong>web scraping <\/strong>sulla privacy, ma anche un catalizzatore per un dialogo globale su come i dati personali debbano essere trattati nell&#8217;era dell&#8217;intelligenza artificiale e della sorveglianza digitale. La direzione che prenderemo come societ\u00e0 globale determiner\u00e0 il futuro della nostra privacy online e la sicurezza dei nostri dati personali.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Web Scraping: il caso Mediaset<\/h3>\n\n\n\n<p>Nell&#8217;epoca dell&#8217;informazione digitale, l&#8217;avanzamento delle tecnologie di intelligenza artificiale (AI) e le pratiche di <strong>web scraping<\/strong> stanno ridefinendo i confini del diritto d&#8217;autore, ponendo nuove sfide legali a enti di trasmissione come Mediaset. <\/p>\n\n\n\n<p>La recente adozione di un disclaimer specifico da parte del colosso mediatico segnala un tentativo di salvaguardare i propri contenuti da un utilizzo non autorizzato nell&#8217;addestramento di sistemi AI.<\/p>\n\n\n\n<p>Mediaset ha introdotto un disclaimer nelle sue trasmissioni che vieta espressamente l&#8217;uso delle immagini per l&#8217;addestramento di AI generative o per operazioni di scraping. Questo passaggio \u00e8 indicativo del crescente bisogno di protezione dei contenuti in un mondo dove la riproduzione e la manipolazione digitale sono sempre pi\u00f9 accessibili.<\/p>\n\n\n\n<p><strong>La Dicotomia tra Protezione e Innovazione<\/strong><\/p>\n\n\n\n<p>Mentre i titolari dei diritti d&#8217;autore come Mediaset vedono nello scraping una minaccia alla propriet\u00e0 intellettuale, alcune personalit\u00e0 pubbliche italiane hanno espresso apprezzamento per l&#8217;uso creativo e umoristico dei loro volti e voci da parte di AI. <\/p>\n\n\n\n<p>Questo contrasto riflette la tensione tra la necessit\u00e0 di tutelare i diritti esclusivi e il desiderio di sfruttare le nuove possibilit\u00e0 offerte dalle tecnologie emergenti.<\/p>\n\n\n\n<p><strong>Conflitti d&#8217;Interessi e Il Futuro del Diritto d&#8217;Autore<\/strong><\/p>\n\n\n\n<p>Il conflitto tra i detentori dei diritti economici e gli interessi dei fan, creatori e soggetti dei video \u00e8 palpabile. L&#8217;articolo 4 della direttiva sul copyright potrebbe legittimare attivit\u00e0 come lo scraping, ma i produttori come Mediaset temono che ci\u00f2 possa erodere i loro diritti esclusivi.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Conclusione <\/h3>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"h-il-genio-fuori-dalla-bottiglia\"><strong>Il &#8220;Genio&#8221; Fuori dalla Bottiglia<\/strong><\/h4>\n\n\n\n<p>La metafora del &#8220;genio uscito dalla bottiglia&#8221; descrive efficacemente la situazione attuale: una volta che i dati sono stati raccolti e utilizzati per &#8220;educare&#8221; modelli di AI, diventa quasi impossibile applicare retroattivamente misure correttive quali la cancellazione dei dati o l&#8217;oblio. Il concetto di &#8220;machine unlearning&#8221;, ovvero la rimozione selettiva di dati dai modelli di apprendimento automatico, \u00e8 tecnicamente complesso e raramente praticabile.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"h-la-risposta-internazionale\"><strong>La Risposta Internazionale<\/strong><\/h4>\n\n\n\n<p>Di fronte a questa problematica, le autorit\u00e0 internazionali hanno iniziato a muoversi, cercando di delineare strategie di contrasto a pratiche percepite come potenzialmente abusive. Il comunicato congiunto di pi\u00f9 Paesi \u00e8 un segnale dell&#8217;urgenza di &#8220;fare qualcosa&#8221; per proteggere i diritti fondamentali degli utenti online, spesso ignari delle minacce rappresentate dallo scraping invisibile.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"h-un-equilibrio-precario-tra-accesso-ai-dati-e-privacy\">Un Equilibrio Precario tra Accesso ai Dati e Privacy<\/h4>\n\n\n\n<p>La necessit\u00e0 di accedere a dataset ampi per l&#8217;addestramento di AI si scontra con l&#8217;importanza della tutela della privacy. Le autorit\u00e0 sollecitano gli operatori del settore digitale, specialmente i social media, a rivedere le loro pratiche e ad adottare un approccio pi\u00f9 responsabile in linea con le normative sulla privacy.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"h-differenze-transatlantiche\"><strong>Differenze Transatlantiche<\/strong><\/h4>\n\n\n\n<p>La distanza tra la visione giuridica europea e quella statunitense sullo scraping, quest&#8217;ultima pi\u00f9 permissiva almeno a livello federale, complica ulteriormente il panorama internazionale, data la natura transfrontaliera del web.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"h-innovazione-responsabile\"><strong>Innovazione Responsabile<\/strong><\/h4>\n\n\n\n<p>\u00c8 fondamentale trovare un equilibrio tra l&#8217;innovazione tecnologica e il rispetto per gli utenti. La consapevolezza dei rischi associati allo scraping \u00e8 cruciale per mantenere l&#8217;integrit\u00e0 e la fiducia nell&#8217;ecosistema digitale.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"h-il-ruolo-delle-piattaforme-digitali\"><strong>Il Ruolo delle Piattaforme Digitali<\/strong><\/h4>\n\n\n\n<p>Le piattaforme digitali si trovano spesso nella posizione di dover compensare le carenze del settore pubblico in termini di comunicazione e sensibilizzazione degli utenti sui rischi dello scraping.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"h-azioni-future\"><strong>Azioni Future<\/strong><\/h4>\n\n\n\n<p>Il grido d&#8217;allarme lanciato dalle istituzioni \u00e8 un primo passo verso azioni di enforcement coordinate. L&#8217;efficacia delle misure proposte dipender\u00e0 dalla capacit\u00e0 di implementare un sistema efficace che coinvolga comunicazione, sensibilizzazione e divulgazione.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"h-il-punto-di-vista-azienda\">Il punto di vista azienda<\/h4>\n\n\n\n<p>Dal punto di vista aziendale, il <strong>web scraping<\/strong> solleva questioni critiche di compliance con il GDPR. Le aziende che non proteggono adeguatamente i loro siti web rischiano di violare gli articoli 25 e 32 del Regolamento, che impongono l&#8217;adozione di misure tecniche e organizzative adeguate per garantire la sicurezza dei dati personali. Le pubbliche amministrazioni e i siti di cronaca, in particolare, devono agire rapidamente per adeguarsi.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"h-innovazioni-nel-filtraggio-del-traffico-web\"><strong>Innovazioni nel Filtraggio del Traffico Web<\/strong><\/h4>\n\n\n\n<p>In risposta a tali sfide, alcuni leader del settore editoriale come il New York Times stanno adottando misure anti-AI per filtrare il traffico in arrivo dai siti di intelligenza artificiale. Secondo Matteo Greatti, CEO di GFTech SRL ed esperto di cyber security, l&#8217;adozione di tecnologie come reverse proxy pu\u00f2 essere un primo passo efficace.<\/p>\n\n\n\n<p>Il <strong>web scraping<\/strong> rimane un argomento controverso che richiede un&#8217;attenta navigazione tra i diritti degli utenti e le esigenze dell&#8217;innovazione tecnologica. Mentre le aziende cercano di proteggersi dallo scraping indiscriminato, le autorit\u00e0 regolatorie e gli esperti del settore devono collaborare per creare un ambiente che rispetti sia la privacy che il progresso tecnologico. La direzione presa dall&#8217;Italia potrebbe ben presto illuminare una nuova via per altri paesi da seguire nell&#8217;era dell&#8217;intelligenza artificiale.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" src=\"https:\/\/www.consultingpb.com\/wp-content\/uploads\/2023\/11\/avv.-bozzo-1-1024x576.jpg\" alt=\"\" class=\"wp-image-4242\" \/><\/figure>\n","protected":false},"excerpt":{"rendered":"<p>Che cosa \u00e8? Il web scraping \u00e8 una tecnica utilizzata per estrarre automaticamente dati da siti web. Consiste nell&#8217;utilizzo di software per navigare nei siti web, individuare i dati desiderati e salvarli in un formato strutturato come un file CSV o un database. \u00c8 un processo automatizzato che consente di raccogliere informazioni da diverse pagine [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":4782,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[44,1],"tags":[300],"class_list":["post-4433","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-diritto-rovescio","category-non-categorizzato","tag-webscraping"],"yoast_head":"<!-- This site is optimized with the Yoast SEO Premium plugin v23.3 (Yoast SEO v25.6) - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Web scraping: il richiamano al rispetto della normativa privacy - PB Consulting<\/title>\n<meta name=\"description\" content=\"**Meta Description:**Esplora le pi\u00f9 avanzate tecniche di Web Scraping e Crawling: guida completa, case study su Trenit, e normative legali.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/\" \/>\n<meta property=\"og:locale\" content=\"en_US\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Web scraping: il richiamano al rispetto della normativa privacy\" \/>\n<meta property=\"og:description\" content=\"**Meta Description:**Esplora le pi\u00f9 avanzate tecniche di Web Scraping e Crawling: guida completa, case study su Trenit, e normative legali.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/\" \/>\n<meta property=\"og:site_name\" content=\"PB Consulting\" \/>\n<meta property=\"article:author\" content=\"https:\/\/www.facebook.com\/alberto.bozzo.9\" \/>\n<meta property=\"article:published_time\" content=\"2023-12-05T23:00:14+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2023-12-05T23:00:16+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.consultingpb.com\/wp-content\/uploads\/2023\/12\/OIG-3.jpeg\" \/>\n\t<meta property=\"og:image:width\" content=\"540\" \/>\n\t<meta property=\"og:image:height\" content=\"540\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Alberto Bozzo\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Alberto Bozzo\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"33 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/\",\"url\":\"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/\",\"name\":\"Web scraping: il richiamano al rispetto della normativa privacy - PB Consulting\",\"isPartOf\":{\"@id\":\"https:\/\/www.consultingpb.com\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/www.consultingpb.com\/wp-content\/uploads\/2023\/12\/OIG-3.jpeg\",\"datePublished\":\"2023-12-05T23:00:14+00:00\",\"dateModified\":\"2023-12-05T23:00:16+00:00\",\"author\":{\"@id\":\"https:\/\/www.consultingpb.com\/#\/schema\/person\/09b2842207e1ed74e87559a8e584fd50\"},\"description\":\"**Meta Description:**Esplora le pi\u00f9 avanzate tecniche di Web Scraping e Crawling: guida completa, case study su Trenit, e normative legali.\",\"breadcrumb\":{\"@id\":\"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/#breadcrumb\"},\"inLanguage\":\"en-US\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"en-US\",\"@id\":\"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/#primaryimage\",\"url\":\"https:\/\/www.consultingpb.com\/wp-content\/uploads\/2023\/12\/OIG-3.jpeg\",\"contentUrl\":\"https:\/\/www.consultingpb.com\/wp-content\/uploads\/2023\/12\/OIG-3.jpeg\",\"width\":540,\"height\":540},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/www.consultingpb.com\/en\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Web scraping: il richiamano al rispetto della normativa privacy\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/www.consultingpb.com\/#website\",\"url\":\"https:\/\/www.consultingpb.com\/\",\"name\":\"PB Consulting\",\"description\":\"\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/www.consultingpb.com\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"en-US\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/www.consultingpb.com\/#\/schema\/person\/09b2842207e1ed74e87559a8e584fd50\",\"name\":\"Alberto Bozzo\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"en-US\",\"@id\":\"https:\/\/www.consultingpb.com\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/417349770ce903a6b3447c4269e5e3cf91964bab004ff7a0336c8434fdf40b46?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/417349770ce903a6b3447c4269e5e3cf91964bab004ff7a0336c8434fdf40b46?s=96&d=mm&r=g\",\"caption\":\"Alberto Bozzo\"},\"sameAs\":[\"https:\/\/www.consultingpb.com\/\",\"https:\/\/www.facebook.com\/alberto.bozzo.9\",\"https:\/\/www.instagram.com\/ab_dirittorovescio\/\",\"https:\/\/www.linkedin.com\/in\/alberto-bozzo-57982b63\/\"],\"url\":\"https:\/\/www.consultingpb.com\/en\/blog\/author\/alberto\/\"}]}<\/script>\n<!-- \/ Yoast SEO Premium plugin. -->","yoast_head_json":{"title":"Web scraping: il richiamano al rispetto della normativa privacy - PB Consulting","description":"**Meta Description:**Esplora le pi\u00f9 avanzate tecniche di Web Scraping e Crawling: guida completa, case study su Trenit, e normative legali.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/","og_locale":"en_US","og_type":"article","og_title":"Web scraping: il richiamano al rispetto della normativa privacy","og_description":"**Meta Description:**Esplora le pi\u00f9 avanzate tecniche di Web Scraping e Crawling: guida completa, case study su Trenit, e normative legali.","og_url":"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/","og_site_name":"PB Consulting","article_author":"https:\/\/www.facebook.com\/alberto.bozzo.9","article_published_time":"2023-12-05T23:00:14+00:00","article_modified_time":"2023-12-05T23:00:16+00:00","og_image":[{"width":540,"height":540,"url":"https:\/\/www.consultingpb.com\/wp-content\/uploads\/2023\/12\/OIG-3.jpeg","type":"image\/jpeg"}],"author":"Alberto Bozzo","twitter_card":"summary_large_image","twitter_misc":{"Written by":"Alberto Bozzo","Est. reading time":"33 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/","url":"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/","name":"Web scraping: il richiamano al rispetto della normativa privacy - PB Consulting","isPartOf":{"@id":"https:\/\/www.consultingpb.com\/#website"},"primaryImageOfPage":{"@id":"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/#primaryimage"},"image":{"@id":"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/#primaryimage"},"thumbnailUrl":"https:\/\/www.consultingpb.com\/wp-content\/uploads\/2023\/12\/OIG-3.jpeg","datePublished":"2023-12-05T23:00:14+00:00","dateModified":"2023-12-05T23:00:16+00:00","author":{"@id":"https:\/\/www.consultingpb.com\/#\/schema\/person\/09b2842207e1ed74e87559a8e584fd50"},"description":"**Meta Description:**Esplora le pi\u00f9 avanzate tecniche di Web Scraping e Crawling: guida completa, case study su Trenit, e normative legali.","breadcrumb":{"@id":"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/#breadcrumb"},"inLanguage":"en-US","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/"]}]},{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/#primaryimage","url":"https:\/\/www.consultingpb.com\/wp-content\/uploads\/2023\/12\/OIG-3.jpeg","contentUrl":"https:\/\/www.consultingpb.com\/wp-content\/uploads\/2023\/12\/OIG-3.jpeg","width":540,"height":540},{"@type":"BreadcrumbList","@id":"https:\/\/www.consultingpb.com\/blog\/diritto-rovescio\/web-scraping-il-richiamano-al-rispetto-della-normativa-privacy\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/www.consultingpb.com\/en\/"},{"@type":"ListItem","position":2,"name":"Web scraping: il richiamano al rispetto della normativa privacy"}]},{"@type":"WebSite","@id":"https:\/\/www.consultingpb.com\/#website","url":"https:\/\/www.consultingpb.com\/","name":"PB Consulting","description":"","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.consultingpb.com\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"en-US"},{"@type":"Person","@id":"https:\/\/www.consultingpb.com\/#\/schema\/person\/09b2842207e1ed74e87559a8e584fd50","name":"Alberto Bozzo","image":{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/www.consultingpb.com\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/417349770ce903a6b3447c4269e5e3cf91964bab004ff7a0336c8434fdf40b46?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/417349770ce903a6b3447c4269e5e3cf91964bab004ff7a0336c8434fdf40b46?s=96&d=mm&r=g","caption":"Alberto Bozzo"},"sameAs":["https:\/\/www.consultingpb.com\/","https:\/\/www.facebook.com\/alberto.bozzo.9","https:\/\/www.instagram.com\/ab_dirittorovescio\/","https:\/\/www.linkedin.com\/in\/alberto-bozzo-57982b63\/"],"url":"https:\/\/www.consultingpb.com\/en\/blog\/author\/alberto\/"}]}},"_links":{"self":[{"href":"https:\/\/www.consultingpb.com\/en\/wp-json\/wp\/v2\/posts\/4433","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.consultingpb.com\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.consultingpb.com\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.consultingpb.com\/en\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.consultingpb.com\/en\/wp-json\/wp\/v2\/comments?post=4433"}],"version-history":[{"count":14,"href":"https:\/\/www.consultingpb.com\/en\/wp-json\/wp\/v2\/posts\/4433\/revisions"}],"predecessor-version":[{"id":4785,"href":"https:\/\/www.consultingpb.com\/en\/wp-json\/wp\/v2\/posts\/4433\/revisions\/4785"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.consultingpb.com\/en\/wp-json\/wp\/v2\/media\/4782"}],"wp:attachment":[{"href":"https:\/\/www.consultingpb.com\/en\/wp-json\/wp\/v2\/media?parent=4433"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.consultingpb.com\/en\/wp-json\/wp\/v2\/categories?post=4433"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.consultingpb.com\/en\/wp-json\/wp\/v2\/tags?post=4433"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}