内容优化

内容优化

Products

当前位置:首页 > 内容优化 >

火车头采集器中,为内容添加html标签的C#脚本

96SEO 2025-01-18 10:56 151


为内容添加html标 理处予不略忽则,等签签,小标题使用<h3>标签,每个段落必须使用<p>标签包裹,重点用<strong>标签包裹。**使用 <strong>,如果内容中已经存在html标签p标签h标签等,则忽略不予处理


using System;
using System.Collections.Generic;
using System.Text.RegularExpressions;
using SpiderInterface;

class LocoyCode
{
    /// <summary>
    /// 执行方法,不能修改类和方法名称。
    /// </summary>
    /// <param name="content">标签内容</param>
    /// <param name="response">页面响应,包含了Url、原始Html等属性</param>
    /// <returns>返回处理后的标签内容</returns>
    public string Run(string content, ResponseEntry response)
    {
        // 分割成段落
        string[] paragraphs = content.Split(new string[] { "\n", "\r\n" }, StringSplitOptions.RemoveEmptyEntries);

        // 处理每个段落
        List<string> processedParagraphs = new List<string>();
        foreach (string paragraph in paragraphs)
        {
            // 检查段落是否已经包含<p>或<h>标签,如果是,则忽略处理
            if (Regex.IsMatch(paragraph, @"<p>|<h\d>", RegexOptions.IgnoreCase))
            {
                processedParagraphs.Add(paragraph);
                continue;
            }

            // 使用<p>标签包裹段落
            string processedParagraph = "<p>" + paragraph + "</p>";

            // 在段落中查找 "**" 并添加<strong>标签
            processedParagraph = Regex.Replace(processedParagraph, @"\*\*(.*?)\*\*", "<strong>$1</strong>");

            processedParagraphs.Add(processedParagraph);
        }

        // 将处理后的段落拼接成完整的内容
        string processedContent = string.Join("", processedParagraphs);

        return processedContent;
    }
}

标签: 火车头采集器


提交需求或反馈

Demand feedback