Question

Я пытаюсь отобразить динамический текстовый файл (robots.txt) в моем приложении Rails (3.0.10), но он продолжает отображать его как HTML (говорит консоль).

match 'robots.txt' => 'sites#robots'

Контроллер:

class SitesController < ApplicationController

  respond_to :html, :js, :xml, :css, :txt

  def robots
    @site = Site.find_by_subdomain # blah blah
  end

end

Приложение / просмотров / сайты / robots.txt.erb:

Sitemap: <%= @site.url %>/sitemap.xml

Но когда я посещаю http://www.example.com/robots.txt, я получаю пустую страницу / источник, и в журнале говорится:

Started GET "/robots.txt" for 127.0.0.1 at 2011-11-21 11:22:13 -0500
  Processing by SitesController#robots as HTML
  Site Load (0.4ms)  SELECT `sites`.* FROM `sites` WHERE (`sites`.`subdomain` = 'blah') ORDER BY created_at DESC LIMIT 1
Completed 406 Not Acceptable in 828ms

Есть идеи, что я делаю не так?

Примечание: я добавил это в config / initializers / mime_types, потому что Rails жаловался на то, что он не знает, что такое mime-тип .txt:

Mime::Type.register_alias "text/plain", :txt

Примечание 2: я удалил стоковый robots.txt из публичного каталога.

Thomas Klemm · Answer 1 · 15 апреля 2013

ПРИМЕЧАНИЕ: Это репост из coderwall .

Чтение некоторых советов с аналогичным ответом на Stackoverflow, который я в настоящее времяиспользуйте следующее решение для рендеринга динамического robots.txt на основе параметра хоста запроса.

Маршрутизация

# config/routes.rb
#
# Dynamic robots.txt
get 'robots.:format' => 'robots#index'

Контроллер

# app/controllers/robots_controller.rb
class RobotsController < ApplicationController
  # No layout
  layout false

  # Render a robots.txt file based on whether the request
  # is performed against a canonical url or not
  # Prevent robots from indexing content served via a CDN twice
  def index
    if canonical_host?
      render 'allow'
    else
      render 'disallow'
    end
  end

  private

  def canonical_host?
    request.host =~ /plugingeek\.com/
  end
end

Просмотры

На основе request.host мы визуализируем один из двух .text.erb файлов просмотра.

Разрешенные роботы

# app/views/robots/allow.text.erb # Note the .text extension

# Allow robots to index the entire site except some specified routes
# rendered when site is visited with the default hostname
# http://www.robotstxt.org/

# ALLOW ROBOTS
User-agent: *
Disallow:

Запрет пауков

# app/views/robots/disallow.text.erb # Note the .text extension

# Disallow robots to index any page on the site
# rendered when robot is visiting the site
# via the Cloudfront CDN URL
# to prevent duplicate indexing
# and search results referencing the Cloudfront URL

# DISALLOW ROBOTS
User-agent: *
Disallow: /

Спецификации

Тестирование настроек с помощью RSpec и Capybara также может быть выполнено довольно легко.

# spec/features/robots_spec.rb
require 'spec_helper'

feature "Robots" do
  context "canonical host" do
    scenario "allow robots to index the site" do
      Capybara.app_host = 'http://www.plugingeek.com'
      visit '/robots.txt'
      Capybara.app_host = nil

      expect(page).to have_content('# ALLOW ROBOTS')
      expect(page).to have_content('User-agent: *')
      expect(page).to have_content('Disallow:')
      expect(page).to have_no_content('Disallow: /')
    end
  end

  context "non-canonical host" do
    scenario "deny robots to index the site" do
      visit '/robots.txt'

      expect(page).to have_content('# DISALLOW ROBOTS')
      expect(page).to have_content('User-agent: *')
      expect(page).to have_content('Disallow: /')
    end
  end
end

# This would be the resulting docs
# Robots
#   canonical host
#      allow robots to index the site
#   non-canonical host
#      deny robots to index the site

В качестве последнего шага вам может понадобиться удалите статический public/robots.txt из общей папки, если он все еще присутствует.

Надеюсь, вы найдете это полезным.Не стесняйтесь комментировать, помогая улучшить эту технику еще больше.

Nathan · Answer 2 · 06 мая 2012

Одно решение, которое работает в Rails 3.2.3 (не уверен в 3.0.10), выглядит следующим образом:

1) Назовите ваш файл шаблона robots.text.erb # Акцент на text против txt

2) Настройте свой маршрут так: match '/robots.:format' => 'sites#robots'

3) Оставьте ваше действие как есть (вы можете удалить response_with в контроллере)

def robots
  @site = Site.find_by_subdomain # blah blah
end

Это решение также устраняет необходимость явного указания txt.erb в вызове render, упомянутом в принятом ответе.

Ronak Jain · Answer 3 · 30 ноября 2015

Мне не нравится, что robots.txt достигает моего веб-сервера.

Если вы используете Nginx / Apache в качестве обратного прокси-сервера, статические файлы будут обрабатываться ими намного быстрее, чем сам запрос, поступающий по рельсам.

Это намного чище, и я думаю, что это тоже быстрее.

Попробуйте использовать следующую настройку.

nginx.conf - для производства

location /robots.txt {
            alias /path-to-your-rails-public-directory/production-robots.txt;
    }

nginx.conf - для этапа

location /robots.txt {
                alias /path-to-your-rails-public-directory/stage-robots.txt;
        }

Benjamin Udink ten Cate · Answer 4 · 21 ноября 2011

Для моих проектов rails у меня обычно есть отдельный контроллер для ответа robots.txt

class RobotsController < ApplicationController
  layout nil

  def index
    host = request.host
    if host == 'lawc.at' then #liveserver
      render 'allow.txt', :content_type => "text/plain"
    else #testserver
      render 'disallow.txt', :content_type => "text/plain"
    end
  end

end

Тогда у меня есть представления с именами: disallow.txt.erb и allow.txt.erb

.

А по моему routes.rb у меня

get "robots.txt" => 'robots#index'

Alex Peattie · Answer 5 · 21 ноября 2011

Я думаю, что проблема в том, что если вы определяете respond_to в вашем контроллере, вы должны использовать respond_with в действии:

def robots
  @site = Site.find_by_subdomain # blah blah
  respond_with @site
end

Также попробуйте явно указать файл .erb длябыть оказанным:

def robots
  @site = Site.find_by_subdomain # blah blah
  render 'sites/robots.txt.erb'
  respond_with @site
end

Rails: динамический robots.txt с erb

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Маршрутизация

Контроллер

Просмотры

Спецификации

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Rails: динамический robots.txt с erb

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Маршрутизация

Контроллер

Просмотры

Спецификации

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов