What ¡to ¡do ¡ When ¡Google ¡ignores ¡your ¡Fedora ¡objects Robin ¡Dean Jonathan ¡Green robin@coalliance.org jonathan@discoverygarden.ca Digital ¡Repository ¡Director Chief ¡Technology ¡Officer Colorado ¡Alliance ¡of ¡Research ¡Libraries discoverygarden ¡inc. Open ¡Repositories ¡2013 CharloGetown, ¡Prince ¡Edward ¡Island, ¡Canada Fedora ¡Users ¡Group ¡– ¡Thursday ¡July ¡11, ¡5:30 ¡PM 1
Alliance ¡ Digital ¡ Repository Fedora ¡3.4.2 Islandora ¡11.3 ¡ ¡ + ¡Drupal ¡6 ¡ ¡ + ¡Core ¡Islandora ¡Modules ¡ + ¡Custom ¡Modules/Viewer hGp://adr.coalliance.org 2
Custom ¡Compound ¡Object ¡Viewer ¡in ¡Islandora ¡6 3
1. ¡Create ¡RSS ¡sitemaps ¡of ¡Fedora ¡ objects ¡for ¡search ¡engines Improving ¡ 2. ¡Improve ¡search ¡results ¡ repository ¡ snippets ¡by ¡re-‑using ¡MODS ¡ search ¡results ¡ metadata ¡in ¡HTML ¡<meta> ¡tags in ¡Google 3. ¡Add ¡meaning ¡for ¡search ¡ engines ¡“behind ¡the ¡scenes” ¡with ¡ RDFa 4
Without ¡Sitemaps ¡(Bing) With ¡Sitemaps ¡(Google) 5
1. ¡ ¡ Index ¡all ¡Fedora ¡objects ¡in ¡ Solr How ¡did ¡we ¡ make ¡RSS ¡ 2. ¡ ¡ Add ¡public ¡objects ¡in ¡Solr ¡to ¡ an ¡RSS ¡feed ¡using ¡Islandora sitemaps ¡in ¡ 3. ¡ ¡ Submit ¡the ¡RSS ¡feed ¡as ¡a ¡ Islandora? sitemap ¡in ¡Google ¡ Webmaster ¡Tools ¡ 6
Sitemap ¡Details ¡from ¡Google ¡Webmaster ¡Tools 7
Trend ¡in ¡Pages ¡Crawled ¡and ¡Pages ¡Indexed Pages ¡ Crawled Pages ¡ Indexed RSS ¡sitemap ¡ Page ¡ Pages ¡ Page ¡error ¡ submiGed ¡ error ¡ indexed ¡ fixed ¡for ¡ October ¡23, ¡ fixed ¡in ¡ starts ¡to ¡ ETDs 2012 Islandora decrease ¡(?) 8
1. Google ¡scholar ¡is ¡trickier. ¡ Uses ¡a ¡different ¡web ¡crawler ¡ than ¡normal ¡Google. What ¡about ¡ Google ¡ 2. ¡Doesn’t ¡accept ¡RSS ¡sitemaps. Scholar? 3. ¡In ¡a ¡large ¡repository, ¡indexer ¡ tends ¡to ¡request ¡a ¡lot ¡of ¡ documents ¡very ¡quickly. 9
1. Create ¡simple ¡HTML ¡pages. Google ¡Scholar 2. ¡ ¡ Create ¡a ¡list ¡of ¡recently ¡added ¡ papers. Sitemaps 3. ¡ ¡ Ensure ¡that ¡Google ¡can ¡ quickly ¡crawl ¡your ¡pages. ¡ 10
Re-‑use ¡descripjve ¡metadata ¡in ¡HTML ¡<meta> ¡descripjon ¡ Islandora ¡Solr ¡Results Google ¡Search ¡Results 11
1. ¡ ¡ Scholar ¡expects ¡meta ¡tags ¡in ¡ its ¡own ¡format. 2. Google ¡Scholar ¡supports Google ¡Scholar -‑ Highwire ¡Press ¡tags Meta ¡Tags -‑ Eprints ¡tags -‑ PRISM ¡tags. ¡ 3. ¡Limited ¡support ¡for ¡Dublin ¡ Core ¡tags. 12
Google ¡Scholar ¡<meta> ¡Tag ¡Examples <meta ¡name="citajon_jtle" ¡content="12-‑Acetoxypseudopterolide" ¡ /> <meta ¡name="citajon_author" ¡content="Ata, ¡A." ¡ /> <meta ¡name="citajon_author" ¡content="Kerr, ¡R. ¡G." ¡ /> <meta ¡name="citajon_author" ¡content=", ¡." ¡ /> <meta ¡name="citajon_publicajon_date" ¡content="2000" ¡ /> <meta ¡name="citajon_journal_jtle" ¡content="" ¡ /> <meta ¡name="citajon_volume" ¡content="53" ¡ /> <meta ¡name="citajon_issue" ¡content="3" ¡ /> <meta ¡name="citajon_firstpage" ¡content="717" ¡ /> 13
Rich ¡results ¡with ¡schema.org ¡microdata hGp://schema.org/Recipe hGp://schema.org/Review 14
Before ¡RDFa Aper ¡RDFa 15
Use ¡an ¡object ¡type ¡that ¡exists ¡in ¡ an ¡ontology ¡we ¡can ¡link ¡to RDFa ¡ Try ¡the ¡MODS ¡RDF ¡elements ¡ fixes ¡and ¡ instead ¡of ¡our ¡homegrown ¡ MODS ¡crosswalk improvements Empty ¡elements ¡should ¡not ¡be ¡ marked ¡up ¡with ¡RDFa 16
Improve ¡crawling Next ¡Steps ¡for ¡ Look ¡to ¡others ¡in ¡the ¡community ¡ Google ¡Scholar ¡ for ¡advice Indexing Create ¡caches ¡that ¡Google ¡ Scholar ¡can ¡crawl ¡faster 17
Robin ¡Dean robin@coalliance.org Quesjons ¡ Digital ¡Repository ¡Director Colorado ¡Alliance ¡of ¡Research ¡Libraries and Discussion Jonathan ¡Green jonathan@discoverygarden.ca Chief ¡Technology ¡Officer discoverygarden ¡inc. 18
Recommend
More recommend