Länkad data inom silon på TV4

31fc3e1970e83d40f3a4036c0a2c7185?s=47 David Hall
April 16, 2013

Länkad data inom silon på TV4

Problem med dataintegration från olika system är ett problem där länkad data skulle kunna hjälpa till. På TV4 skapade vi ett verktyg, Annotagger, för att koppla ihop ID:n för samma begrepp i olika system.

31fc3e1970e83d40f3a4036c0a2c7185?s=128

David Hall

April 16, 2013
Tweet

Transcript

  1. Länkad data inom silon David Hall, TV4 @moonhouse

  2. TV4-Gruppen §Sänder dagligen på ungefär 30 TV-kanaler TV4, Sjuan, TV4

    Fakta, TV4 Fakta XL, TV4 Sport, TV4 Sport XL, TV4 Film, TV4 Komedi, TV4 Guld, TV11 samt närmare tjugo kanaler via Cmore §Över 100 000 klipp och program samt dagliga livesändningar på TV4 Play, Csports och Filmnet.se.
  3. Nytt tv4.se §Projekt som påbörjades 2011 §Mål: – mer centrerat

    kring videoinnehåll – program, personer, karaktärer och ämnen centrala begrepp – data ska i största hand komma in automatiskt från övriga system och kopplas ihop utan manuell påverkan (exempelvis tablåer och videoklipp) §Arbetsmål: – Inte bygga upp ny monolit – Laga saker tidigt i kedjan §Årets sajt alla kategorier i Sverige 2012 enligt Internetworld
  4. None
  5. None
  6. Foto: SF/TV4 Definitioner §Helst inte kategorier – Vad är drama?

    – Vad är underhållning? – TV4, SVT och TT Spektra har olika definitioner. §Vad är en film? – Är Beck en dramaserie eller råkar bara vara en serie av långfilmer?
  7. Foto: ABC/TV4 Problem 1: tablåer §Tablåläggningssystemet är uppbyggt kring kontrakt

    om program §Vi vet vilket kontrakt vi sänder på en viss tidpunkt i en viss kanal §Ett avtal kan bestå av flera säsonger av samma program §Kort sagt: vi vet inte riktigt vilken säsong och vilket avsnitt vi egentligen sänder §Problem även för externa konsumenter av vårt data – EPG-er i digitalboxar
  8. Problem 2: videomaterial §Avsnitt och klipp i videoform på webben

    uppbyggd separat från tablån
  9. Foto: Samuel Wåhlstedt/TV4 Problem 3: fritexttaggning §Videor och artiklar med

    fria nyckelord §Mycket felstavningar §Taggar som visar på organisatoriska egenheter (“Skelle eå” alltid ihop med “Umeå”) §Är Trelleborg ett företag, kommun, ort eller fotbollslag?
  10. Annotagger §Litet verktyg för att slå ihop material från olika

    källor §Taggtyper: – Program – Person – Ämne §En tagg har – namn – beskrivning – typ – externa id:n (tablåsystem, videosystem, gammalt CMS) – annan information vi behöver
  11. Foto: Warner Bros/TV4

  12. Utanför silon då? §Externa datakällor för att öka kvaliteten –

    minskad risk för dubbletter – undvika felstavningar §Kunna integrera externt data – t.ex. ta in externa recensioner av filmer – länka till Wikipedia-artiklar §Ge externa tjänster möjlighet att bygga på vårt innehåll – Open Graph/Knowledge graph för förbättrad sökmöjlighet/delning – öka syndikering – betala för leads
  13. Google.se

  14. Parallella projekt §Red Bee Media förädlar vårt data för tablåändamål

    §För filmer är IMDB-id ett naturligt sätt att identifiera den på webben. Vi arbetar med detta också.
  15. Källa: Pressmeddelande från Nyhetsbolaget 12 april 2013 2013-04-12 Utökat samarbete

    mellan Nyhetsbolaget och Sprinkle ger mer webb-tv- innehåll på flera tidningssajter Nyhetsbolaget utökar samarbetet med Sprinkle, en intelligent rekommendationsmotor som kopplar tidningssajters nyhetsartiklar till relaterat webb-tv-innehåll. Det utökade samarbetet innebär att Sprinkle nu erbjuder ett 40-tal publicister inom Stampen, Mittmedia och Promedia att med Nyhetsbolagets innehåll stärka sitt webb-tv-utbud. I februari gick Sprinkles intelligenta rekommendationsmotor live på gp.se, med Nyhetsbolaget som exklusiv innehållsleverantör. Detta innebär att besökarna får relevant webb-tv material rekommenderat baserat på innehållet i artikeln de läst. Besökarna kan därmed ta del av ytterligare rörliga nyheter och klipp inom samma eller liknande ämnesområde, vilket ger en hög relevans för varje unik besökare och tillfälle. Nu fördjupas samarbetet mellan Nyhetsbolaget och Sprinkle, och tjänsten rullas inom kort ut på ett flertal nya sajter inom Stampen-, Mittmedia- och Promedia-koncernerna, som Sprinkle, via utvecklnigsbolaget MKT Media har ett ramavtal med. Bland det 40-tal sajter som nu erbjuds tjänsten finns den redan idag live på gp.se och vlt.se. - Sprinkle är en smart tjänst och genom den matchning som sker mellan de publicerade artiklarna och vårt webb-tv-material når vi ut till nya tittare, samtidigt som vårt material lever längre. Det ger också många redaktioner nya möjligheter att utöka mängden webb-tv-innehåll på sina sajter på ett enkelt och snabbt sätt, säger Lenka Prokopec Karlberg, affärschef Nyhetsbolaget. - Nyhetsbolaget är precis den samarbetspartner vi vill arbeta nära med. De har högkvalitativt innehåll och de förstår värdet av att nå sina tittare lokalt. Under första månadens test hos Göteborgs-Posten har vi sett en stor ökning av webb-tv-konsumtionen, lokalt såväl som nationellt och internationellt. Konverteringsgraden låg på otroliga 4,5 procent på artikelnivå och det konsumerades över 5 000 timmar webb-tv från över 2 000 olika klipp, säger Magnus Hultman, vd Sprinkle.
  16. Foto: Fremantle/TV4 Tekniskt förberedda §Annotagger har förberetts – inbyggt stöd

    för länkar till Freebase från början §Redaktörerna har inte utbildats §Används egentligen inte än
  17. http.tv4.se